Puces IA : l'actif le plus convoité de la nouvelle économie numérique

Longtemps cantonnée au vocabulaire des ingénieurs, la puce IA a pris en quelques années une dimension qui dépasse largement le champ technique. Composant clé de l'entraînement et de l'inférence des grands modèles de langage, des systèmes de vision par ordinateur et de l'automatisation industrielle, elle concentre aujourd'hui des enjeux économiques, géopolitiques et industriels d'une ampleur sans précédent dans l'histoire récente des technologies. Comprendre ce qu'est une puce IA, et ce qu'elle représente réellement comme actif stratégique, est devenu une nécessité pour quiconque analyse les dynamiques de la nouvelle économie numérique.

Ce que recouvre exactement la notion de "puce IA"

Le terme "puce IA" désigne de façon générique tout circuit intégré spécialisé dans l'exécution de calculs intensifs liés à l'intelligence artificielle. Il ne s'agit pas d'une architecture unique, mais d'une famille de composants aux caractéristiques différentes selon les cas d'usage.

Les GPU (Graphics Processing Units), à l'origine conçus pour le rendu graphique, ont été les premiers à être massivement adoptés pour l'entraînement des modèles de deep learning, en raison de leur capacité à effectuer des milliers d'opérations mathématiques en parallèle. NVIDIA, qui a su anticiper ce pivot dès la fin des années 2000 avec sa plateforme CUDA, domine aujourd'hui ce segment avec ses architectures Ampere, Hopper et Blackwell, représentées respectivement par les puces A100, H100, H200 et la série B100.

Les TPU (Tensor Processing Units), développés par Google depuis 2016, constituent le premier exemple de silicium propriétaire conçu spécifiquement pour les réseaux de neurones. À la différence des GPU polyvalents, ils sont optimisés pour un type de calcul matriciel très précis, ce qui leur confère des avantages en termes d'efficacité énergétique et de coût à performance égale pour les tâches d'inférence à grande échelle.

Les NPU (Neural Processing Units) sont des coprocesseurs embarqués dans des SoC (System-on-Chip), présents notamment dans les smartphones et ordinateurs personnels. L'Apple Neural Engine, intégré dans les puces M-series depuis 2020, en est l'exemple le plus connu. Ces processeurs permettent d'exécuter localement des tâches d'IA sans recourir au cloud.

La distinction entre GPU, TPU et NPU structure trois marchés distincts : l'entraînement en data center (GPU, très capitalistique), l'inférence à grande échelle (GPU et TPU propriétaires) et l'IA embarquée à la périphérie du réseau (NPU). Chacun obéit à des dynamiques concurrentielles et à des chaînes de valeur spécifiques.

Une chaîne de valeur concentrée sur un nombre restreint d'acteurs

La production d'une puce IA avancée suppose la maîtrise de plusieurs maillons technologiques dont la complexité cumulée a conduit à une concentration extrême de l'offre mondiale autour de trois acteurs pivots.

TSMC (Taiwan Semiconductor Manufacturing Company) assure la fabrication physique des puces les plus avancées au monde sur ses procédés 3 nanomètres et au-delà. Fondeur contractuel, il produit pour NVIDIA, Apple, AMD, Qualcomm et un nombre croissant de concepteurs de puces propriétaires. Sa position géographique à Taïwan constitue l'une des variables géopolitiques les plus surveillées de l'industrie technologique mondiale.

ASML, entreprise néerlandaise, détient un quasi-monopole mondial sur les machines de lithographie EUV (Extreme Ultraviolet), indispensables pour graver des transistors à l'échelle nanométrique. Sans machine ASML, aucune fonderie ne peut produire des puces de dernière génération. Ce positionnement unique confère à ASML un levier sans équivalent dans la chaîne d'approvisionnement mondiale des semiconducteurs.

NVIDIA domine pour sa part la conception des GPU pour l'IA, avec une avance technologique et logicielle considérable sur ses concurrents. L'écosystème CUDA, développé depuis 2007, représente aujourd'hui une barrière à l'entrée logicielle qui s'ajoute aux barrières matérielles : les développeurs, les bibliothèques et les frameworks IA sont massivement optimisés pour les architectures NVIDIA.

La géopolitique du silicium : quand les puces deviennent un instrument de politique étrangère

La concentration de la chaîne de valeur des puces IA a conduit les gouvernements à en faire un levier central de leur politique industrielle et de sécurité nationale. Les États-Unis ont été les premiers à agir de façon structurée, en restreignant dès octobre 2022, puis de façon élargie en 2023 et 2024, les exportations de puces IA avancées vers la Chine via les listes de contrôle du Bureau of Industry and Security (BIS). Ces mesures ciblent notamment les GPU NVIDIA H100 et A100, dont la puissance de calcul dépasse les seuils autorisés à l'export.

Sur le plan de la réindustrialisation, le CHIPS and Science Act américain, promulgué en août 2022, mobilise 52,7 milliards de dollars pour soutenir la fabrication domestique de semiconducteurs, avec pour objectif de réduire la dépendance aux fonderies asiatiques. TSMC, Samsung et Intel ont annoncé des usines en Arizona et en Ohio dans ce cadre.

L'Europe a répondu avec l'European Chips Act, adopté en 2023, qui vise à mobiliser 43 milliards d'euros d'investissements publics et privés d'ici 2030, avec l'objectif déclaré de porter la part de l'Europe dans la production mondiale de semiconducteurs à 20 %. TSMC a annoncé la construction d'une usine à Dresde (Allemagne), en partenariat avec Bosch, Infineon et NXP.

La désintermédiation par le silicium propriétaire : la stratégie des hyperscalers

Face au coût et à la dépendance que représente l'approvisionnement en puces NVIDIA, les principaux acteurs du cloud ont engagé depuis plusieurs années une stratégie de développement de silicium propriétaire pour leurs propres infrastructures d'IA.

Google est le pionnier de cette approche avec ses TPU, dont la quatrième génération (TPUv4) alimente aujourd'hui les services Google Search, Google Translate et les modèles Gemini. Amazon Web Services a développé les puces Trainium (pour l'entraînement) et Inferentia (pour l'inférence), déployées dans ses data centers. Microsoft a présenté sa puce Azure Maia, dédiée à l'inférence de grands modèles de langage. Meta a annoncé son MTIA (Meta Training and Inference Accelerator) pour réduire sa dépendance aux GPU tiers dans ses infrastructures d'entraînement.

Cette tendance à la verticalisation du silicium répond à plusieurs logiques simultanées : réduction des coûts marginaux à grande échelle, optimisation de l'efficacité énergétique, différenciation concurrentielle et sécurisation des approvisionnements face aux tensions géopolitiques et aux tensions de capacité chez les fondeurs.

Ce qu'il faut retenir

La puce IA recouvre trois familles distinctes (GPU, TPU, NPU) aux marchés et dynamiques différents
Trois acteurs pivots structurent la chaîne de valeur mondiale : NVIDIA (conception), TSMC (fabrication), ASML (équipements EUV)
Les États-Unis ont restreint l'export de GPU IA avancés vers la Chine depuis 2022 via le BIS
CHIPS Act américain (52,7 Mrd$) et European Chips Act (43 Mrd€) visent à relocaliser la production
Google, Amazon, Microsoft et Meta développent leur propre silicium pour réduire leur dépendance à NVIDIA
L'efficacité énergétique est devenue un critère de différenciation aussi important que la performance brute

Efficacité énergétique : la prochaine frontière concurrentielle

L'essor des grands modèles d'IA a mis en lumière une contrainte que la course à la performance brute avait jusqu'ici reléguée au second plan : la consommation électrique. L'entraînement d'un grand modèle de langage mobilise des milliers de GPU pendant plusieurs semaines ou mois, avec une facture énergétique qui peut atteindre plusieurs gigawatts-heure. L'inférence à grande échelle, exécutée en continu pour des millions d'utilisateurs simultanés, représente une charge permanente et croissante pour les data centers.

Cette réalité a modifié les critères d'évaluation des puces IA. La performance par watt est devenue un indicateur aussi stratégique que les téraflops bruts. C'est précisément sur cet axe que les puces spécialisées (TPU, Trainium, Inferentia, Maia) revendiquent leur avantage par rapport aux GPU polyvalents : en sacrifiant la flexibilité au profit d'une architecture optimisée pour un type de calcul précis, elles peuvent exécuter les mêmes tâches avec une consommation significativement réduite.

La pression réglementaire européenne sur l'empreinte carbone des infrastructures numériques, combinée à la hausse des coûts de l'énergie, renforce ce mouvement. Les opérateurs de data centers en Europe intègrent désormais l'efficacité énergétique comme critère d'achat de premier rang, et non plus comme facteur secondaire.

La puce IA n'est plus un composant parmi d'autres : elle est devenue le point de convergence d'enjeux technologiques, économiques et géopolitiques d'une ampleur qui justifie pleinement son statut d'actif stratégique. La concentration extrême de sa chaîne de valeur, l'instrumentalisation croissante de son contrôle par les États et le mouvement de verticalisation engagé par les hyperscalers dessinent un paysage industriel en recomposition profonde. Les entreprises qui ne comprennent pas ce que recouvre précisément cet actif, et les rapports de force qu'il génère, se privent d'une clé de lecture essentielle pour anticiper les trajectoires de l'économie numérique des prochaines années.

Puce IA : derrière la définition, un actif stratégique au coeur de la nouvelle économie numérique

Ce que recouvre exactement la notion de "puce IA"

Une chaîne de valeur concentrée sur un nombre restreint d'acteurs

La géopolitique du silicium : quand les puces deviennent un instrument de politique étrangère

La désintermédiation par le silicium propriétaire : la stratégie des hyperscalers

Efficacité énergétique : la prochaine frontière concurrentielle