Collecter la donnée qui apprend aux robots à manipuler des objets reste un travail ingrat, physique et coûteux. La start-up américaine XDOF vient de lever 70 millions de dollars pour en faire un métier à part entière, et plusieurs grands laboratoires d’IA figurent déjà parmi ses clients.
Le vrai goulot d’étranglement de la robotique
Les modèles qui font marcher, voir et raisonner les robots progressent vite. Ce qui bloque, c’est la donnée de manipulation physique : des milliers d’exemples de gestes réels, capturés avec précision, pour apprendre à une machine à saisir, plier ou déplacer des objets. Cette matière première manque cruellement, et les laboratoires les plus avancés rechignent à la produire eux-mêmes.
Fondée en octobre 2024 par Philipp Wu, Fred Shentu et Nemo Jin, XDOF s’est positionnée exactement sur ce manque. La société a bouclé un tour de 70 millions de dollars mené par Thrive Capital, Spark Capital, a16z, Lux et WndrCo. En moins de deux ans, elle revendique déjà une vingtaine de clients, dont plusieurs laboratoires d’IA de premier plan qu’elle ne nomme pas.
Trois sources de données, un seul produit
XDOF combine trois méthodes de collecte. La première repose sur la téléopération de robots réels déployés sur le terrain. La deuxième utilise des dispositifs GELLO, des manettes spécialisées qui permettent de piloter finement un bras robotisé. La troisième passe par des capteurs portés directement par des humains, qui enregistrent les mouvements du quotidien en vue égocentrique.
Avec le laboratoire de recherche en IA de l’université de Berkeley, la société a publié ce qu’elle présente comme le plus grand jeu de données de manipulation robotique de haute qualité à ce jour : 130 000 trajectoires, 300 heures de simulation et 100 heures d’évaluations. Parmi les tâches entraînées, on trouve le pliage de chemises ou le rangement de boîtiers d’écouteurs.
Pourquoi les labos sous-traitent
Monter une telle infrastructure en interne supposerait des centaines de milliers de mètres carrés d’entrepôt, des centaines de robots, et une armée d’opérateurs formés à la calibration et à la maintenance. Plutôt que d’absorber cette complexité, les laboratoires préfèrent la sous-traiter. Le fait qu’ils paient déjà XDOF, plutôt que de bâtir leurs propres chaînes, en dit long sur leur calcul stratégique.
Concrètement, la collecte de données robotiques devient une vraie couche d’infrastructure, au même titre que le calcul ou le stockage. XDOF compte une soixantaine d’employés et fait tourner ses opérations à l’échelle de l’entrepôt. Le risque existe : si la start-up monte ses prix ou laisse filer la qualité, ses clients pourraient internaliser. Mais pour l’instant, le pari d’une « usine à données » physique pour la robotique trouve preneur.