Industrie

Rhoda AI lève 450 millions : ses robots s’entraînent en regardant des vidéos sur internet

Par La Rédaction ⏱ 3 min de lecture

Rhoda AI vient de lever 450 millions de dollars a une valorisation de 1,7 milliard. La startup americaine, basee a Palo Alto, sort officiellement de son mode furtif avec un projet qui tranche avec les approches classiques : entrainer ses robots en les faisant regarder des millions de videos disponibles sur internet.

Jagdeep Singh, de l’energie aux bras robotiques

Derriere Rhoda AI, il y a Jagdeep Singh. L’entrepreneur est connu pour avoir fonde et dirige QuantumScape, l’une des entreprises les plus ambitieuses du secteur des batteries solides. Apres les batteries, il se retrouve face a un autre probleme dur : rendre les robots fiables dans le monde reel.

Singh a passe des mois a maintenir un profil LinkedIn au titre enigmatique « CEO at Stealth Startup ». Cette semaine, le voile est leve. Son entreprise s’appelle Rhoda AI, et elle vient d’annoncer un tour de financement de 450 millions de dollars, portant sa valorisation a 1,7 milliard de dollars selon Bloomberg. La startup avait deja leve 230 millions lors de tours precedents.

Le probleme des LLM appliques aux robots

Rhoda AI part d’un constat simple mais difficile a resoudre. Les robots d’aujourd’hui fonctionnent bien dans les conditions ou ils ont ete entraines. Changez legerement la disposition des objets, l’eclairage ou la geometrie de la piece, et beaucoup echouent. Singh appelle ca le « robustness gap » : l’ecart entre ce qui marche en laboratoire et ce qui marche dans un vrai entrepot ou une vraie usine.

Pour combler cet ecart, Rhoda AI a developpe un modele appele DVA (Direct Video-Action). L’idee : plutot que de collecter des donnees de teleop eration couteux, on entraine le modele sur des centaines de millions de videos accessibles en ligne. Des humains en train de cuisiner, de trier des objets, d’emballer des colis. Le robot apprend a generaliser depuis ces observations brutes.

Une premiere demonstration bimanuale

La premiere video publique de Rhoda AI montre deux bras robotiques ouvrant une boite en carton. Ca peut sembler banal. En pratique, ouvrir une boite implique de gerer des materiaux deformables, d’appliquer la bonne force, de coordonner les deux bras en temps reel. C’est le type de tache que les systemes actuels realisent bien en conditions controlees, mais ratent des que le carton est legerement ecrase ou different du modele vu en entrainement.

Le hardware de Rhoda AI utilise une camera embarquee dans la main (eye-on-hand sensing), ce qui facilite la generalisation visuelle quand l’environnement change. La plateforme est decrite comme un systeme bimanual a usage general, concu pour les taches industrielles lourdes.

Un secteur en pleine ebullition financiere

Rhoda AI rejoint un ecosysteme de startups robotiques qui ont leve des montants considerables ces derniers mois. Neura Robotics a annonce 1 milliard d’euros aupres de Tether. Physical Intelligence (Pi) multiplie les demos de manipulation. Figure AI a valide son approche chez BMW. Ce meme mardi, AMI Labs de Yann LeCun annonce 1,03 milliard pour des world models.

La somme investie dans l’intelligence physique sur les douze derniers mois depasse ce que le secteur avait accumule en dix ans. L’enjeu : creer des robots capables d’apprendre rapidement de nouvelles taches sans des mois de programmation sur mesure. Rhoda AI parie que la reponse se trouve dans les videos que des milliards d’humains ont deja publiees en ligne.