Accueil High tech Google révolutionne la robotique avec Gemini, des robots à usage général

Google révolutionne la robotique avec Gemini, des robots à usage général

High tech

12 mars 2025

Google révolutionne la robotique avec Gemini, des robots à usage général

Dans une avancée révolutionnaire, Google DeepMind présente Gemini Robotics, redéfinissant le rôle de l’IA dans le monde physique. Grâce à son modèle « vision-language-action », Gemini permet aux robots de comprendre, interagir et manier des tâches complexes, mettant en œuvre une intelligence incarnée au service de la quotidienneté.

Google DeepMind a récemment annoncé Gemini Robotics, une initiative ambitieuse visant à intégrer l’IA dans le monde physique avec des modèles capables de réaliser une gamme plus vaste de tâches du monde réel.

Pour que l’IA soit utile dans le monde physique, elle doit démontrer un raisonnement « incarné »—la capacité humaine de comprendre et de réagir à notre environnement—et prendre des actions sûres pour accomplir des tâches.

Sommaire

L’objectif : des robots polyvalents

Sundar Pichai, PDG de Google, a souligné que l’entreprise considère la robotique comme un terrain d’essai précieux pour transposer les avancées de l’IA dans le monde physique. Le projet « Gemini Robotics » s’articule autour d’un modèle de vision-langage-action (VLA) bâti sur Gemini 2.0, avec l’ajout d’actions physiques comme nouvelle modalité de sortie, visant à contrôler directement les robots.

Google met en avant trois qualités principales pour ces modèles robotiques IA :

1. Généralité

Les robots doivent être capables de s’adapter à des situations variées. Gemini Robotics excelle à traiter de nouveaux objets, des instructions diverses et des environnements inédits, même pour des tâches non rencontrées lors de l’entraînement, grâce à la compréhension sous-jacente du monde par Gemini.

Vous aimerez aussi : Samsung développe des contrôleurs innovants pour casque XR Android : une révolution en perspective

2. Interactivité

Les modèles doivent comprendre et réagir rapidement aux instructions ou aux changements dans leur environnement. Le nouveau modèle de Google peut répondre à des commandes formulées dans un langage courant, conversationnel et dans différentes langues.

3. Dextérité

Ces modèles doivent pouvoir accomplir des tâches que les humains réalisent généralement avec leurs mains et leurs doigts, comme manipuler des objets avec précision. Par exemple, les robots de Gemini peuvent réaliser des activités complexes et en plusieurs étapes nécessitant une manipulation précise, telles que le pliage d’origami ou l’emballage d’une collation dans un sac Ziploc.

Améliorations du modèle

Google a également introduit le modèle Gemini Robotics-ER (raisonnement incarné) de vision-langage avec une compréhension spatiale accrue du monde, essentielle pour la robotique, en mettant l’accent sur le raisonnement spatial. Cela permet aux roboticiens de le connecter à leurs contrôleurs de niveau inférieur existants.

Par exemple, lorsqu’il est présenté avec une tasse de café, le modèle peut déduire une prise à deux doigts appropriée pour la soulever par l’anse et déterminer une trajectoire sûre pour s’en approcher.

Application pratique et partenaires de test

Ces modèles sont conçus pour fonctionner sur divers formats de robots, y compris des robots à bras bi-articulés et des robots humanoïdes, avec la collaboration de testeurs de confiance comme Agile Robots, Agility Robots, Boston Dynamics, et Enchanted Tools.

En conclusion, les initiatives de Google DeepMind avec Gemini Robotics symbolisent un nouveau chapitre dans le développement des robots polyvalents, avec l’objectif de rendre l’intelligence artificielle utile et bénéfique dans notre vie quotidienne grâce à l’innovation en matière de robotique. Cette avancée offre un potentiel réjouissant—celui d’un monde où les robots assistent les humains dans une multitude de tâches, apportant ainsi un soutien tangible à nos existences.

Vous aimerez aussi : Galaxy Z Flip 7 : batterie optimisée pour une endurance améliorée

Mon avis :

L’annonce de Gemini Robotics par Google DeepMind marque une avancée significative dans l’intégration de l’IA dans le monde physique, offrant des robots capables d’accomplir des tâches variées grâce à un modèle vision-langage-action. Bien que prometteuse, cette technologie soulève des défis en matière de sécurité et d’adaptation environnementale, démontrant toutefois des prouesses en manipulation complexe, tels l’origami et la coordination bimanuelle.

Les questions fréquentes

Qu’est-ce que Gemini Robotics annoncé par Google DeepMind ?

Gemini Robotics est une initiative annoncée par Google DeepMind pour intégrer Gemini et l’intelligence artificielle dans le monde physique. Les nouveaux modèles de Gemini Robotics sont capables de réaliser une plus large gamme de tâches réelles que jamais auparavant.

Quels sont les objectifs principaux de Gemini Robotics ?

L’objectif est de créer des robots polyvalents qui peuvent démontrer un raisonnement "incarné", c’est-à-dire la capacité humaine à comprendre et réagir à l’environnement. Ces robots doivent également pouvoir agir en toute sécurité pour accomplir des tâches. Google voit la robotique comme un terrain d’essai utile pour traduire les avancées de l’IA dans le monde physique.

Quelles sont les caractéristiques principales des modèles de robots AI de Google ?

Google identifie trois qualités principales pour ses modèles de robots AI : la généralité, l’interactivité et la dextérité. Cela signifie que Gemini Robotics peut s’adapter à de nouvelles situations, comprendre et répondre rapidement aux instructions, et manipuler des objets avec précision de manière à réaliser des tâches complexes.

Avec quels types de robots les modèles Gemini Robotics sont-ils compatibles ?

Les modèles de Gemini Robotics fonctionnent sur divers types de robots, y compris des robots à deux bras et des robots humanoïdes. Des partenaires de confiance tels qu’Agile Robots, Agility Robots, Boston Dynamics et Enchanted Tools testent ces modèles.

Plus

Signaler

Vous aimerez aussi : Logiciel planning : une solution flexible pour la gestion du temps

Articles relatifs:

High tech

12 mars 2025

byDominique Bernard

Add a comment Add a comment

Laisser un commentaire Annuler la réponse

Lexus rz : autonomie et puissance améliorées avec la première finition F Sport

Mobilité

12 mars 2025

Retard de HomePad : garantir la cohérence du design avec iOS 19 après la WWDC

Apple

12 mars 2025

Recommended for You

Galaxy Watch ultra, Galaxy S25 ultra et Surface Pro : les innovations high-tech à ne pas manquer

High tech

byDominique Bernard

Testez dès maintenant la puissance du rendu d’images natif de Gemini 2.0 Flash

High tech

byDominique Bernard

Chromecast 2e génération et audio : comment résoudre les erreurs de diffusion en cas de panne 'non fiable'

Chromecast 2e génération et audio: solutionnez les problèmes de diffusion en cas de panne ‘non fiable’

High tech

byDominique Bernard

Offre exceptionnelle : final fantasy 1 à 6 avec 33 % de réduction et bien plus encore

High tech

byDominique Bernard

Maximisez votre expérience : le Galaxy Z Flip optimise les applications sur l’écran de couverture avec One UI 7.

High tech

byDominique Bernard

Android 16 beta 3 : mise à jour imminente pour les utilisateurs de Pixel

High tech

byDominique Bernard

Google met fin à la vente du Chromecast avec Google TV : ce que cela signifie pour les utilisateurs

Android 14 débarque sur chromecast avec google tv : améliorez votre expérience de streaming

High tech

byDominique Bernard

Améliorations caméra pour le Galaxy Z Fold 7 : le smartphone pliable à surveiller

High tech

byDominique Bernard

Lectric XP Trike à 1 399 € avec 420 € de matériel gratuit, EcoFlow et bien plus encore

MagSafe Monday : la MagFusion d’AMEGAT, un chargeur innovant au design moderne semblable à l’iSight

Une simple application finance créée en deux heures suite à un tweet

macOS 15.5 beta 2 accessible aux développeurs : les nouveautés à ne pas manquer