Chine et Asie

Horizon Robotics ouvre HoloMotion-1, un modèle de 4 milliards de paramètres qui tourne à 300 FPS sur les humanoïdes en local

Par La Rédaction ⏱ 4 min de lecture

Horizon Robotics a publié en open source HoloMotion-1, un modèle de fondation pour le contrôle moteur des robots humanoïdes. Le chiffre qui retient l’attention : 4 milliards de paramètres, pour un système traditionnellement compté en millions ou en dizaines de millions. Et tout cela tourne à 300 images par seconde sur le matériel embarqué du robot, sans cloud.

L’entreprise chinoise, plus connue pour ses puces d’aide à la conduite, étend ses ambitions à la robotique embodied. Elle qualifie HoloMotion-1 de « cerebellum », un module spécialisé dans la coordination motrice fine, par opposition aux modèles cognitifs de plus haut niveau qui gèrent la planification.

Humanoïde Unitree G1 effectuant des mouvements complexes grâce à HoloMotion-1
Illustration RoboActu

Un transformer entraîné sur des vidéos « in the wild »

La technique repose sur un transformer mixture-of-experts qui n’active qu’une fraction de ses paramètres à chaque étape pour économiser de la puissance de calcul. Couplée à un cache clé-valeur, cette architecture permet d’atteindre 200 à 300 cycles par seconde sur le processeur embarqué, pendant que la boucle de contrôle moteur tourne à 50 Hz pour lisser les mouvements.

Le vrai pari de Horizon, c’est le mix de données utilisé pour l’entraînement. Plutôt que de se limiter aux datasets de motion capture en laboratoire, l’équipe a ajouté des données de mouvement reconstruites à partir de vidéos prises dans la nature. Cette diversité doit aider le robot à gérer des situations imprévues où ses capteurs ne fournissent pas une information parfaite.

L’entraînement utilise une variante de PPO appliquée à des segments entiers de mouvement plutôt qu’à des pas de temps isolés. C’est une approche plus stable face à un dataset hétérogène, et l’équipe de recherche a publié sa méthodologie sur arXiv.

Du zero-shot transfer sur un Unitree G1

Pour valider l’approche, Horizon a installé HoloMotion-1 directement sur un humanoïde Unitree G1, sans entraînement complémentaire sur du matériel réel. Tous les calculs tournent sur l’ordinateur embarqué du robot.

Résultat : le G1 a réussi à reproduire des mouvements jamais entraînés sur hardware physique, dont du break dance, du rampage, de la position assise et même des coups de pied de style arts martiaux. Le système gère aussi le contrôle live par humain via une combinaison de motion capture ou un casque VR, avec une réponse fluide.

Concrètement, ce que démontre HoloMotion-1, c’est qu’un modèle entraîné en simulation peut transférer directement au monde réel sans réajustement local, ce que la robotique appelle le sim-to-real zero-shot. C’est l’un des problèmes durs du domaine.

Le plan en quatre étapes

Les chercheurs présentent un cadre en quatre marches pour la robotique humanoïde : imiter n’importe quelle pose, suivre n’importe quelle instruction, se déplacer sur n’importe quel terrain, et fonctionner sur n’importe quel type de robot. HoloMotion-1 boucle la première étape en permettant à un humanoïde de copier une large palette de mouvements depuis une vidéo ou une instruction live.

Le positionnement n’est pas anodin. Horizon Robotics, dont le siège est à Shanghai, vient marcher sur les plates-bandes de Tesla, Figure AI et Nvidia avec leurs propres modèles de fondation pour robots. La différence : le code et les poids sont en open source, ce qui place Horizon dans la même logique que Menlo Research avec Asimov 1 ou des labos chinois comme RLWRLD côté coréen.

Pour les fabricants d’humanoïdes qui ne veulent pas dépendre d’un éditeur de modèles propriétaire, c’est une option de plus. Pour Nvidia et son écosystème Isaac, c’est un concurrent qui débarque sans demander de licence, et qui prouve qu’on peut faire tourner un modèle de 4 milliards de paramètres à 300 FPS sur un ordinateur de robot, sans data center derrière.

🤖 Robots mentionnés dans cet article