Dans un paysage technologique en constante évolution, Google a une fois de plus marqué les esprits en dévoilant Ironwood, sa septième génération d’unité de traitement tensoriel ou Tensor Processing Unit(TPU). Contrairement aux générations précédentes qui ont largement contribué à l’entraînement et au déploiement de modèles d’IA, Ironwood se distingue comme la première TPU de Google spécifiquement conçue pour l’inférence. Cette innovation arrive à un moment charnière, une ère que Google nomme « l’âge de l’inférence », où l’IA passe d’une simple réponse à des requêtes à une génération proactive d’informations et d’interprétations. On peut donc dire que Google frappe fort avec sa nouvelle génération d’unité de traitement tensoriel.
Une puissance de calcul inégalée au service de la pensée artificielle
Ironwood n’est pas qu’une simple mise à niveau ; c’est un bond colossal en termes de puissance de calcul. Capable de monter jusqu’à un impressionnant total de 9 216 puces, cette nouvelle TPU délivre une puissance de calcul phénoménale de 42,5 Exaflops. Pour mettre cela en perspective, Google affirme qu’Ironwood offre plus de 24 fois la puissance de calcul du plus grand superordinateur mondial actuel, El Capitan, qui offre seulement 1,7 Exaflops par pod. Chaque puce individuelle culmine à une performance de 4 614 TFLOPs. Cette puissance massive est essentielle pour gérer les charges de travail intensives des « modèles de pensée », tels que les grands modèles de langage (LLM) et les architectures de type « mixture of experts » (MoE). L’objectif est de minimiser les déplacements de données et la latence au sein de la puce tout en exécutant des manipulations de tenseurs à grande échelle.

L’efficacité énergétique au cœur de l’innovation
Si la puissance brute impressionne, l’efficacité énergétique d’Ironwood est tout aussi remarquable. Google met en avant le fait que l’efficacité énergétique (performance par watt) d’Ironwood est deux fois supérieure à celle de Trillium, leur TPU de sixième génération annoncée l’année dernière. Dans un contexte où la consommation d’énergie des infrastructures IA est une préoccupation croissante, cette amélioration est cruciale. Ironwood se révèle même être près de 30 fois plus économe en énergie que la première Cloud TPU de Google lancée en 2018. Cette efficacité est obtenue grâce à une conception optimisée de la puce et à des solutions de refroidissement liquide avancées, permettant de maintenir des performances élevées de manière fiable.
Des améliorations techniques significatives pour des performances optimales
Outre sa puissance et son efficacité, Ironwood intègre plusieurs améliorations techniques clés qui contribuent à ses performances exceptionnelles. On note une augmentation substantielle de la capacité de la mémoire à haute bande passante (HBM), atteignant 192 Go par puce, soit six fois plus que Trillium, ce qui permet le traitement de modèles et d’ensembles de données plus volumineux et réduit le besoin de transferts de données fréquents. La bande passante HBM a également été considérablement améliorée, atteignant 7,2 TBps par puce, soit 4,5 fois celle de Trillium, assurant un accès rapide aux données pour les charges de travail gourmandes en mémoire.
Un contenu de qualité, sans publicité.
Vous aimez notre travail ? Soutenez notre indépendance en devenant membre sur Patreon.
Soutenir MyChromebook.frEnfin, la bande passante de l’Inter-Chip Interconnect (ICI) a été augmentée à 1,2 Tbps bidirectionnel, soit 1,5 fois celle de Trillium, facilitant une communication plus rapide entre les puces pour un entraînement et une inférence distribués efficaces à grande échelle. Ironwood bénéficie également d’un Enhanced SparseCore, un accélérateur spécialisé pour le traitement des très grandes bases de données d’embeddings utilisées dans le classement et la recommandation. Cette prise en charge étendue de SparseCore permet d’accélérer un plus large éventail de charges de travail, au-delà de l’IA traditionnelle, vers les domaines financier et scientifique.

Flexibilité pour les clients Google Cloud et orchestration avancée
Pour répondre aux divers besoins de ses clients, Ironwood sera disponible sur Google Cloud en deux configurations : une avec 256 puces et une autre avec 9 216 puces. Cette flexibilité permet aux entreprises de choisir la puissance de calcul la mieux adaptée à leurs charges de travail d’IA. De plus, les développeurs pourront tirer parti de Pathways, l’environnement d’exécution ML de Google DeepMind, pour exploiter efficacement la puissance combinée de dizaines de milliers de TPU Ironwood. Pathways facilite l’informatique distribuée sur de multiples puces TPU, permettant de repousser les limites du calcul pour l’IA générative. Le réseau ICI à faible latence et à haute bande passante d’Ironwood permet une communication coordonnée et synchrone à l’échelle d’un pod TPU complet.
ASUS Chromebook CX3402CBA-MW0197
| Marque | ASUS |
| Nom de modèle | CX3402CBA-MW0197 |
| Taille de l’écran | 14 Pouces |
| Couleur | PEARL WHITE |
| Taille du disque dur | 256 Go |
| Modèle du CPU | Core i3 |
| Taille de la mémoire RAM installée | 8 Go |
Google frappe fort avec sa nouvelle génération d’unité de traitement tensoriel
Google souligne sa plus de dix ans d’expérience dans la fourniture de calcul IA pour la recherche de pointe, intégré de manière transparente dans ses services à l’échelle mondiale comme Gmail et Search. Cette expertise est au cœur des capacités d’Ironwood. Des modèles de pointe tels que Gemini 2.5 et AlphaFold, lauréat du prix Nobel, fonctionnent déjà sur des TPU aujourd’hui. Avec l’arrivée d’Ironwood plus tard cette année, Google se montre impatient de découvrir les nouvelles avancées que ses propres développeurs et les clients de Google Cloud pourront réaliser. Ironwood représente une avancée significative, conçue pour répondre aux exigences de l’ère de l’inférence et donner les moyens de créer des IA toujours plus performantes et perspicaces.

