Dark Mode Light Mode

Google dévoile le TPU Ironwood de 7e génération et Lyria, l’outil innovant de création musicale.

Google dévoile le TPU Ironwood de 7e génération et Lyria, l'outil innovant de création musicale. Google dévoile le TPU Ironwood de 7e génération et Lyria, l'outil innovant de création musicale.

Lors de l’événement Cloud Next 2025, Google a dévoilé sa toute nouvelle unité de traitement Tensor (TPU), Ironwood, la plus performante et évolutive à ce jour. Conçue pour l’IA, Ironwood promet une efficacité énergétique inégalée et ouvre la voie à l’« ère de l’inférence », révolutionnant ainsi la manière dont les modèles d’IA génèrent des données.

Ironwood

La TPU Ironwood est désignée comme le « processeur d’IA personnalisé le plus performant et évolutif » de Google à ce jour, tout en étant respectueuse de l’environnement et « la première conçue spécifiquement pour l’inférence. » Cette unité est capable de traiter des modèles d’IA qui transforment la façon dont les données sont analysées et interprétées, favorisant une génération proactive d’insights. Cela signifie que nous entrons dans l' »ère de l’inférence », où les agents d’IA récupèrent et génèrent activement des données pour fournir des réponses collaboratives et des insights au lieu de simples données.

La TPU Ironwood représente un changement significatif dans le développement de l’IA et de l’infrastructure qui alimente son avancement.

En particulier, Ironwood est conçu pour répondre aux exigences des modèles de réflexion, tels que les Large Language Models (LLMs), les Mixtures of Experts (MoEs), et les tâches de raisonnement avancées. Ces modèles nécessitent un traitement parallèle massif et un accès efficace à la mémoire. Cela est accompli en minimisant le mouvement des données et la latence sur puce tout en exécutant d’énormes manipulations de tenseurs.

Les exigences computationnelles des modèles de réflexion s’étendent bien au-delà de la capacité d’une seule puce. Nous avons conçu les TPUs Ironwood avec un réseau ICI à faible latence et de haute bande passante pour soutenir une communication coordonnée et synchrone à l’échelle totale du pod TPU.

Les clients de Google Cloud peuvent accéder à une configuration de 256 ou 9 216 puces – chaque puce offrant une puissance de calcul de 4 614 TFLOPs. Le second pod présente une puissance totale de 42,5 Exaflops, soit « plus de 24 fois la puissance informatique du plus grand superordinateur au monde – El Capitan – qui offre juste 1,7 Exaflops par pod. »

Vous aimerez aussi :  OnePlus Watch 3 de retour avec une augmentation de prix spectaculaire : que vaut vraiment cette montre connectée ?

La TPU Ironwood offre des performances par watt deux fois plus élevées par rapport à la 6ème génération, Trillium annoncée en 2024, tout en présentant 192 Go de High Bandwidth Memory par puce (6 fois plus que Trillium).

Pathways est le runtime distribué de Google qui alimente l’infrastructure interne d’entraînement et d’inférence à grande échelle. Il est désormais accessible aux clients de Google Cloud.

Gemini 2.5 Flash

Gemini 2.5 Flash est le modèle de travail de Google où la faible latence et le coût sont prioritaires. Bientôt disponible sur Vertex AI, il présente un raisonnement « dynamique et contrôlable. »

Le modèle ajuste automatiquement le temps de traitement (« budget de réflexion ») en fonction de la complexité de la requête, permettant des réponses plus rapides pour des demandes simples. Vous pouvez également contrôler ce budget avec précision, permettant un équilibrage explicite entre la vitesse, l’exactitude et le coût pour vos besoins spécifiques.

Les cas d’utilisation à fort volume incluent le service client et le traitement d’informations en temps réel.

Modèles AI Génératifs

Google met à présent à la disposition des clients entreprises son modèle Lyria, qui génère de la musique à partir de texte en version « preview avec liste d’autorisation » sur Vertex AI. Ce modèle peut créer des audio de haute fidélité dans une gamme de genres. Les entreprises peuvent l’utiliser pour créer rapidement des bandes sonores qui correspondent à l’identité unique d’une marque.

Lyria élimine ces obstacles, permettant de créer des morceaux de musique sur mesure en quelques minutes, en parfaite adéquation avec l’humeur, le rythme et le récit de votre contenu. Cela peut contribuer à accélérer les flux de production et à réduire les coûts de licence.

Par exemple, une invite pourrait être : « Composer un morceau de bebop à haute énergie. Prioriser des solos de saxophone et de trompette à couper le souffle, échanger des phrases complexes à la vitesse de l’éclair… ».

Vous aimerez aussi :  Ce lecteur de cassettes inspiré de l'ingénierie pour adolescents dispose même d'une "cassette Bluetooth" pour écouter Spotify.

Parallèlement, Veo 2 obtient des fonctionnalités d’édition permettant de modifier des séquences existantes :

  • Inpainting : Obtenez des éditions propres et professionnelles sans retouche manuelle. Vous pouvez supprimer des images de fond indésirables, des logos ou des distractions de vos vidéos, pour qu’elles disparaissent harmonieusement de chaque image.
  • Outpainting : Étendez le cadre des séquences vidéo existantes, transformant des vidéos traditionnelles en formats optimisés pour le web et les plateformes mobiles.

De même, l’édition d’Imagen 3 dispose d’améliorations pour le « inpainting » afin de reconstruire des portions manquantes ou endommagées d’une image, ainsi que pour la suppression d’objets.

Chirp 3 est le modèle de compréhension et de génération audio de Google. Il propose des « voix HD » avec une parole naturelle et réaliste dans plus de 35 langues avec huit options de locuteurs. L’aspect compréhension alimente une nouvelle fonctionnalité qui « sépare et identifie précisément les locuteurs individuels dans les enregistrements multi-locuteurs » pour une meilleure transcription.

Une autre nouvelle fonctionnalité permet à Chirp 3 de « générer des voix personnalisées réalistes à partir de 10 secondes d’audio. » Cela permet aux entreprises de personnaliser les centres d’appels, de développer du contenu accessible et d’établir des voix de marque uniques tout en maintenant une identité de marque cohérente.

Pour assurer une utilisation responsable, Instant Custom Voice inclut des fonctionnalités de sécurité intégrées, et notre processus de liste d’autorisation implique une diligence rigoureuse pour vérifier les autorisations d’utilisation appropriées.

En ce qui concerne la sécurité, « SynthID » de DeepMind incorpore des filigranes invisibles dans chaque image, vidéo et cadre audio produit par Imagen, Veo et Lyria.

Vous aimerez aussi :  Android 16 beta 3.2 : amélioration de la batterie des Pixel et retour haptique optimisé

Mon avis :

Le TPU Ironwood de Google, conçu spécifiquement pour l’inférence, offre une performance impressionnante avec 4,614 TFLOPs par puce, doublant l’efficacité énergétique de son prédécesseur. Bien que cette avancée prenne en charge de puissants modèles d’IA, son coût d’accès (environ 23 000 euros pour 9,216 puces) pourrait freiner l’adoption.

Les questions fréquentes

Qu’est-ce que la TPU Ironwood de Google ?

La TPU Ironwood est la septième génération d’unité de traitement Tensor de Google. Elle est décrite comme le « plus performant et évolutif accélérateur AI personnalisé à ce jour » et est spécialement conçue pour l’inférence, offrant une capacité de traitement parallèle massive et un accès mémoire efficace.

Quels sont les avantages de la TPU Ironwood par rapport à la génération précédente ?

La TPU Ironwood offre une performance par watt deux fois supérieure à celle de la génération précédente Trillium, tout en disposant de 192 Go de mémoire à large bande par puce, représentant une augmentation de six fois par rapport à Trillium.

Comment la TPU Ironwood gère-t-elle les modèles d’intelligence artificielle ?

La TPU Ironwood est conçue pour gérer des modèles de réflexion, incluant des modèles de langage de grande taille (LLMs) et des tâches de raisonnement avancées. Elle minimise le mouvement des données et la latence sur la puce, tout en permettant des manipulations massives de tenseurs, ce qui est crucial pour le traitement simultané des demandes computationnelles.

Quels modèles d’IA générative Google propose-t-il ?

Google propose plusieurs modèles d’IA générative, notamment Lyria pour la génération de musique et Chirp 3 pour la compréhension et la génération audio. Lyria permet aux entreprises de créer rapidement des pistes audio adaptées à leur identité de marque, tandis que Chirp 3 offre des voix réalistes et des fonctionnalités avancées comme la séparation des locuteurs dans les enregistrements multi-locuteurs.

Restez au courant des nouvelles les plus importantes

En cliquant sur le bouton « S'abonner », vous confirmez que vous avez lu et que vous acceptez notre politique de confidentialité et nos conditions d'utilisation.
Add a comment Add a comment

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Previous Post

Découvrez Les 5 Outils Japonais Essentiels Pour Booster Votre Productivité au Bureau !

Next Post
Google lance Workspace Flows : l'automatisation révolutionnaire avec Gemini Gems

Google lance Workspace Flows : l'automatisation révolutionnaire avec Gemini Gems

Ajouter à la Collection

Pas De Collections

Vous trouverez ici toutes les collections que vous avez créé auparavant.