Chine et Asie

AGIBOT publie un dataset open source de robots qui ratent leurs prises et renversent du liquide pour aider l’IA incarnée à apprendre du chaos réel

Par La Rédaction ⏱ 5 min de lecture

La startup chinoise AGIBOT a annoncé le 3 juin 2026 depuis Shanghai la publication d’AGIBOT WORLD 2026 Theme 2 : Rich Interaction, un dataset open source qui collectionne tout ce que les modèles de robotique évitent d’habitude. Les ratés. Les collisions. Les chutes d’objets. Les éclaboussures de liquide. L’objectif assumé : entraîner la prochaine génération d’intelligence artificielle incarnée à comprendre le monde physique tel qu’il est, pas tel qu’on aimerait qu’il soit.

Le contraste avec les jeux de données habituels est frappant. Les corpus de référence comme Open X-Embodiment, RT-1 ou les démonstrations Helix de Figure AI privilégient les exécutions propres : un bras saisit une tasse, la déplace, la repose au bon endroit. Tout ce qui sort de cette trajectoire idéale est exclu pour ne pas dégrader l’apprentissage par imitation. AGIBOT prend l’angle inverse en revendiquant la valeur informative des échecs.

Main robotique avec capteurs tactiles laissant échapper un verre, gros plan macro
Illustration RoboActu

De la téléopération exploratoire et 100 % de données réelles

Selon l’annonce de la société, le dataset est construit à partir d’enregistrements 100 % issus du monde physique. Pas de simulation, pas de captation accélérée. Les opérateurs humains pilotent les robots en téléopération exploratoire, ce qui veut dire qu’ils choisissent volontairement des objets variés en termes de matériau, de géométrie, de structure mécanique et de fonction. L’idée est de balayer la diversité physique réelle plutôt que de répéter mille fois la même tâche.

Le système enregistre alors aussi bien les manipulations réussies que les événements imparfaits mais riches en information : préhensions ratées, contacts instables, objets qui tombent, collisions latérales, éclaboussures de liquide. Pour chaque interaction, le corpus garde les retours sensoriels multimodaux, la dynamique du contact, la déformation du matériau et la réponse mécanique. Autant de signaux que les simulateurs traditionnels peinent à reproduire avec fidélité.

Boucher le trou des « world models »

AGIBOT positionne explicitement ce dataset comme un coup de pioche dans un problème souvent cité par la recherche en embodied AI : la pénurie de données sur les phénomènes physiques tangents. Les world models, ces réseaux qui apprennent à prédire le comportement futur d’une scène, ont besoin de voir des contre-exemples pour comprendre les frontières du possible. Un robot qui ne tombe jamais ne sait pas comment se rattraper. Un préhenseur qui ne lâche jamais ne sait pas reconnaître un objet qui glisse.

Le corpus est donc pensé pour les chercheurs qui travaillent sur les simulateurs neuronaux, sur la perception informée par la physique et sur l’apprentissage de représentations robustes. Les modèles vision-langage-action de type Helix de Figure ou GR00T de NVIDIA peuvent y trouver une matière brute pour mieux gérer les cas limites. AGIBOT publie aussi un projet companion : AGIBOT WORLD 2026 Theme 1, lui aussi en open source, qui rassemblait les démonstrations classiques d’imitation. Les deux ensembles couvrent donc à la fois le geste idéal et son revers.

Une stratégie d’écosystème pour AGIBOT

Le geste s’inscrit dans une logique commerciale assumée. AGIBOT se présente comme une entreprise de modèles fondamentaux pour la robotique. Son architecture « Three Intelligences in One » fusionne intelligence de locomotion, intelligence d’interaction et intelligence de manipulation dans un système incarné unique. La gamme couvre humanoïdes, quadrupèdes, mains dextres et solutions de nettoyage commercial. Ouvrir un dataset de qualité, c’est attirer la recherche académique vers ses primitives logicielles avant que NVIDIA, Hugging Face ou les laboratoires de Boston Dynamics n’imposent les leurs.

Le timing n’est pas anodin. AgiLink, autre startup chinoise de mains robotiques liée à la galaxie AGIBOT, vient d’atteindre le milliard de dollars de valorisation en 150 jours avec le soutien de Xiaomi et Li Auto. NVIDIA a dévoilé hier à Computex Taipei son Isaac GR00T Reference Humanoid bâti sur l’Unitree H2 Plus. La course aux briques fondamentales de l’IA physique se joue à coups de releases successives, et publier un dataset libre est devenu un argument commercial autant qu’un acte scientifique.

Disponibilité et impact attendu

Le dataset est mis à disposition via Hugging Face sous le namespace agibot-world, ainsi que sur la page du projet agibot-world.com. Aucun chiffre précis n’a été communiqué sur le volume de données collectées ni sur le nombre d’heures d’enregistrement, mais AGIBOT promet de nouvelles vagues de publication dans les mois qui viennent, avec d’autres thèmes, des benchmarks dédiés et des ressources annexes pour la communauté. La question intéressante sera de savoir si les laboratoires académiques européens, encore à la recherche de jeux d’entraînement souverains, vont s’en saisir, ou si la Chine prendra une longueur d’avance en imposant son corpus de référence pour les world models robotiques.

🤖 Robots mentionnés dans cet article