Industrie

ROBOTIS apprend à danser à son humanoïde open source AI Sapiens à partir d’une simple vidéo, sans capture de mouvement

Par La Rédaction ⏱ 2 min de lecture

Apprendre à danser à un robot sans le moindre capteur de capture de mouvement, juste à partir d’une vidéo. C’est ce qu’a réussi une équipe travaillant sur AI Sapiens, l’humanoïde open source de ROBOTIS, avec un résultat d’une fluidité étonnante.

Humanoïde open source AI Sapiens de ROBOTIS en train de danser
Crédit : ROBOTIS / via @passionvirus

De la vidéo 2D au mouvement réel

La méthode est la partie la plus intéressante. L’équipe a extrait un mouvement en trois dimensions à partir d’une simple vidéo 2D, sans système de motion capture, ces installations coûteuses où un acteur porte des marqueurs filmés par des dizaines de caméras. Le geste humain devient ainsi une donnée d’entraînement directement exploitable.

Ce mouvement a ensuite été appris dans NVIDIA Isaac Sim, l’environnement de simulation utilisé pour entraîner des robots avant de les confronter au monde réel. Le robot répète des milliers de fois dans le simulateur, puis transfère ce qu’il a appris sur sa version physique.

Réduire l’écart entre simulation et réalité

Le point dur de cette approche porte un nom : le Sim2Real gap. C’est l’écart entre un comportement parfait en simulation et son exécution sur un vrai robot, où les frottements, les jeux mécaniques et la latence dégradent tout. Plus cet écart est grand, plus le robot devient maladroit une fois sorti de l’ordinateur.

L’équipe affirme avoir atteint un écart très faible grâce aux actionneurs DYNAMIXEL-Q, des moteurs haute précision développés par ROBOTIS. Résultat : un mouvement de danse fluide, sans à-coups visibles, là où beaucoup d’humanoïdes restent saccadés.

L’intérêt de l’open source

AI Sapiens est une plateforme ouverte. Cela signifie que d’autres laboratoires peuvent reprendre l’architecture, la modifier et tester leurs propres algorithmes de locomotion. La démonstration de la danse n’est pas un gadget. Elle prouve qu’un pipeline complet, de la vidéo brute au robot réel, peut produire des gestes complexes sans matériel de capture hors de prix.

Pour la communauté robotique, ce type de méthode abaisse la barrière. Filmer un humain qui bouge devient une façon viable de programmer un humanoïde. La danse aujourd’hui, des tâches utiles demain.

🤖 Robots mentionnés dans cet article