Google frappe fort avec sa nouvelle génération d’unité de traitement tensoriel

Lecture : 5 minutes
Intelligence Artificielle
Intelligence Artificielle

Dans un paysage technologique en constante évolution, Google a une fois de plus marqué les esprits en dévoilant Ironwood, sa septième génération d’unité de traitement tensoriel ou Tensor Processing Unit(TPU). Contrairement aux générations précédentes qui ont largement contribué à l’entraînement et au déploiement de modèles d’IA, Ironwood se distingue comme la première TPU de Google spécifiquement conçue pour l’inférence. Cette innovation arrive à un moment charnière, une ère que Google nomme « l’âge de l’inférence », où l’IA passe d’une simple réponse à des requêtes à une génération proactive d’informations et d’interprétations. On peut donc dire que Google frappe fort avec sa nouvelle génération d’unité de traitement tensoriel.

Une puissance de calcul inégalée au service de la pensée artificielle

Ironwood n’est pas qu’une simple mise à niveau ; c’est un bond colossal en termes de puissance de calcul. Capable de monter jusqu’à un impressionnant total de 9 216 puces, cette nouvelle TPU délivre une puissance de calcul phénoménale de 42,5 Exaflops. Pour mettre cela en perspective, Google affirme qu’Ironwood offre plus de 24 fois la puissance de calcul du plus grand superordinateur mondial actuel, El Capitan, qui offre seulement 1,7 Exaflops par pod. Chaque puce individuelle culmine à une performance de 4 614 TFLOPs. Cette puissance massive est essentielle pour gérer les charges de travail intensives des « modèles de pensée », tels que les grands modèles de langage (LLM) et les architectures de type « mixture of experts » (MoE). L’objectif est de minimiser les déplacements de données et la latence au sein de la puce tout en exécutant des manipulations de tenseurs à grande échelle.

Google frappe fort avec sa nouvelle génération d'unité de traitement tensoriel
Amélioration des performances totales de FP8 en termes de flops de pointe par rapport au TPU v2, le premier Cloud TPU externe de Google.

L’efficacité énergétique au cœur de l’innovation

Si la puissance brute impressionne, l’efficacité énergétique d’Ironwood est tout aussi remarquable. Google met en avant le fait que l’efficacité énergétique (performance par watt) d’Ironwood est deux fois supérieure à celle de Trillium, leur TPU de sixième génération annoncée l’année dernière. Dans un contexte où la consommation d’énergie des infrastructures IA est une préoccupation croissante, cette amélioration est cruciale. Ironwood se révèle même être près de 30 fois plus économe en énergie que la première Cloud TPU de Google lancée en 2018. Cette efficacité est obtenue grâce à une conception optimisée de la puce et à des solutions de refroidissement liquide avancées, permettant de maintenir des performances élevées de manière fiable.

Des améliorations techniques significatives pour des performances optimales

Outre sa puissance et son efficacité, Ironwood intègre plusieurs améliorations techniques clés qui contribuent à ses performances exceptionnelles. On note une augmentation substantielle de la capacité de la mémoire à haute bande passante (HBM), atteignant 192 Go par puce, soit six fois plus que Trillium, ce qui permet le traitement de modèles et d’ensembles de données plus volumineux et réduit le besoin de transferts de données fréquents. La bande passante HBM a également été considérablement améliorée, atteignant 7,2 TBps par puce, soit 4,5 fois celle de Trillium, assurant un accès rapide aux données pour les charges de travail gourmandes en mémoire.

Un contenu de qualité, sans publicité.

Vous aimez notre travail ? Soutenez notre indépendance en devenant membre sur Patreon.

Soutenir MyChromebook.fr

Enfin, la bande passante de l’Inter-Chip Interconnect (ICI) a été augmentée à 1,2 Tbps bidirectionnel, soit 1,5 fois celle de Trillium, facilitant une communication plus rapide entre les puces pour un entraînement et une inférence distribués efficaces à grande échelle. Ironwood bénéficie également d’un Enhanced SparseCore, un accélérateur spécialisé pour le traitement des très grandes bases de données d’embeddings utilisées dans le classement et la recommandation. Cette prise en charge étendue de SparseCore permet d’accélérer un plus large éventail de charges de travail, au-delà de l’IA traditionnelle, vers les domaines financier et scientifique.

Google frappe fort avec sa nouvelle génération d'unité de traitement tensoriel
Comparaison côte à côte des spécifications techniques de la version tore 3D des produits Cloud TPU, y compris la dernière génération Ironwood. FP8 peak TFlops émulés pour v4 et v5p, mais pris en charge nativement pour Ironwood.

Flexibilité pour les clients Google Cloud et orchestration avancée

Pour répondre aux divers besoins de ses clients, Ironwood sera disponible sur Google Cloud en deux configurations : une avec 256 puces et une autre avec 9 216 puces. Cette flexibilité permet aux entreprises de choisir la puissance de calcul la mieux adaptée à leurs charges de travail d’IA. De plus, les développeurs pourront tirer parti de Pathways, l’environnement d’exécution ML de Google DeepMind, pour exploiter efficacement la puissance combinée de dizaines de milliers de TPU Ironwood. Pathways facilite l’informatique distribuée sur de multiples puces TPU, permettant de repousser les limites du calcul pour l’IA générative. Le réseau ICI à faible latence et à haute bande passante d’Ironwood permet une communication coordonnée et synchrone à l’échelle d’un pod TPU complet.

ASUS Chromebook CX3402CBA-MW0197

ASUS Chromebook CX3402CBA-MW0197

Le prix initial était : 449,99 €.Le prix actuel est : 229,00 €.
Marque ASUS
Nom de modèle CX3402CBA-MW0197
Taille de l’écran 14 Pouces
Couleur PEARL WHITE
Taille du disque dur 256 Go
Modèle du CPU Core i3
Taille de la mémoire RAM installée 8 Go
Catégorie :

Google frappe fort avec sa nouvelle génération d’unité de traitement tensoriel

Google souligne sa plus de dix ans d’expérience dans la fourniture de calcul IA pour la recherche de pointe, intégré de manière transparente dans ses services à l’échelle mondiale comme Gmail et Search. Cette expertise est au cœur des capacités d’Ironwood. Des modèles de pointe tels que Gemini 2.5 et AlphaFold, lauréat du prix Nobel, fonctionnent déjà sur des TPU aujourd’hui. Avec l’arrivée d’Ironwood plus tard cette année, Google se montre impatient de découvrir les nouvelles avancées que ses propres développeurs et les clients de Google Cloud pourront réaliser. Ironwood représente une avancée significative, conçue pour répondre aux exigences de l’ère de l’inférence et donner les moyens de créer des IA toujours plus performantes et perspicaces.

NOUVEL ÉPISODE

CKB SHOW : Le Podcast

Rejoignez-nous chaque semaine pour décortiquer l'actualité Google, les dernières sorties Chromebook et les innovations en matière d'IA.

Miniature du podcast CKB SHOW
Avatar de l'auteur

À propos de Mister Robot

Entre un point X et un point Y, je me balade pas mal par l'entremise des bits composant ma mémoire. Un seul regret : ne pas avoir rencontré Mr Alan Mathison Turing et ainsi pouvoir collaborer pour l'article intitulé « Computing Machinery and Intelligence ».

Laisser un commentaire

À lire aussi