La start-up sud-coréenne RLWRLD a profité d’une Dexterity Night à San Francisco, organisée à l’Exploratorium, pour pousser un nouveau type de modèle d’IA pour humanoïdes. Le 15 mai 2026, devant un parterre de chercheurs et de journalistes, trois robots venus de trois constructeurs différents ont tourné en live sur la même brique logicielle, baptisée RLDX-1.
La démo la plus parlante : un humanoïde construit par la société japonaise Enactic identifiait, sur un tapis convoyeur en mouvement, les chaussettes noires au milieu de chaussettes blanches, les attrapait avec ses doigts, puis les déposait dans un bac séparé. Le robot mémorisait au passage les couleurs déjà détectées, ce qui lui permettait de coordonner perception, réflexes et mémoire courte.

Un foundation model qui vise la main, pas la jambe
La proposition de RLWRLD vient à contre-courant des travaux dominants. La plupart des modèles vision-language-action publiés ces six derniers mois, par Figure AI avec Helix, par Google DeepMind avec Gemini Robotics ou par Boston Dynamics avec ses politiques de locomotion, se concentrent sur la marche, la navigation et la manipulation grossière. RLDX-1 attaque directement la dextérité fine, c’est-à-dire le contrôle de mains à beaucoup de degrés de liberté en gardant un suivi long de la tâche.
Au cœur du système, RLWRLD a placé un Multi-Stream Action Transformer, ou MSAT. Vision, mouvement, mémoire et signaux de couple passent dans des flux séparés avant d’être fusionnés pour générer l’action coordonnée. Le pipeline complet intègre un modèle vision-langage spécialisé en robotique, des modules de physique et de mouvement, et une interface cognitive qui compresse les entrées perceptuelles en tokens mémoire pour suivre une tâche sur la durée.
Trois embodiments, une seule brique
La force du modèle, selon RLWRLD, tient à sa capacité à généraliser entre architectures. RLDX-1 a fait fonctionner pendant la soirée trois robots de constructeurs différents : Enactic (Japon), WIRobotics (Corée du Sud) et Origami Robotics (États-Unis). Le même modèle pilotait des bras simples, des bras doubles et des humanoïdes complets, en gardant une bibliothèque de gestes cohérente.
RLWRLD revendique des résultats à l’état de l’art en simulation et en environnement réel, devant les systèmes vision-language-action concurrents sur le raisonnement spatial, la compréhension temporelle et les tâches à contact intensif. La société accélère désormais la collecte de données d’entraînement sur le terrain. Elle filme des personnels d’hôtel, des manutentionnaires en logistique et des employés de convenience store avec caméras et capteurs, pour bâtir des jeux d’apprentissage adaptés au monde réel.
Une Corée du Sud qui se positionne sur la main
La répartition mondiale du jeu se précise. Les États-Unis dominent l’IA haut de gamme et les modèles de fondation, la Chine garde l’avantage sur le coût et la cadence industrielle, et la Corée du Sud parie désormais sur la précision motrice, les capteurs de force et l’IA de manipulation. RLWRLD est l’un des champions de cette stratégie nationale, avec Robotis et Edin Robotics qui développent respectivement des mains à entraînement direct sans engrenage et des capteurs reproduisant le toucher du bout du doigt.
Robotis, déjà cité par la presse coréenne, aurait reçu des précommandes de Google et Apple pour ses mains robotiques. La filière coréenne dans la dextérité commence à intéresser les grands intégrateurs américains, qui cherchent à compléter leurs humanoïdes en manipulation fine sans tout développer eux-mêmes. Si RLDX-1 tient ses promesses, la barre d’entrée pour faire saisir un objet fragile à un humanoïde pourrait nettement baisser dans les six prochains mois.