Apprendre à danser à un robot sans le moindre capteur de capture de mouvement, juste à partir d’une vidéo. C’est ce qu’a réussi une équipe travaillant sur AI Sapiens, l’humanoïde open source de ROBOTIS, avec un résultat d’une fluidité étonnante.

De la vidéo 2D au mouvement réel
La méthode est la partie la plus intéressante. L’équipe a extrait un mouvement en trois dimensions à partir d’une simple vidéo 2D, sans système de motion capture, ces installations coûteuses où un acteur porte des marqueurs filmés par des dizaines de caméras. Le geste humain devient ainsi une donnée d’entraînement directement exploitable.
Ce mouvement a ensuite été appris dans NVIDIA Isaac Sim, l’environnement de simulation utilisé pour entraîner des robots avant de les confronter au monde réel. Le robot répète des milliers de fois dans le simulateur, puis transfère ce qu’il a appris sur sa version physique.
Réduire l’écart entre simulation et réalité
Le point dur de cette approche porte un nom : le Sim2Real gap. C’est l’écart entre un comportement parfait en simulation et son exécution sur un vrai robot, où les frottements, les jeux mécaniques et la latence dégradent tout. Plus cet écart est grand, plus le robot devient maladroit une fois sorti de l’ordinateur.
L’équipe affirme avoir atteint un écart très faible grâce aux actionneurs DYNAMIXEL-Q, des moteurs haute précision développés par ROBOTIS. Résultat : un mouvement de danse fluide, sans à-coups visibles, là où beaucoup d’humanoïdes restent saccadés.
L’intérêt de l’open source
AI Sapiens est une plateforme ouverte. Cela signifie que d’autres laboratoires peuvent reprendre l’architecture, la modifier et tester leurs propres algorithmes de locomotion. La démonstration de la danse n’est pas un gadget. Elle prouve qu’un pipeline complet, de la vidéo brute au robot réel, peut produire des gestes complexes sans matériel de capture hors de prix.
Pour la communauté robotique, ce type de méthode abaisse la barrière. Filmer un humain qui bouge devient une façon viable de programmer un humanoïde. La danse aujourd’hui, des tâches utiles demain.
