AMD a annoncé le 22 mai 2026 une collaboration de recherche entre sa filiale Silo AI, le département d’informatique de l’université de Bologne (DISI) et le constructeur italien d’humanoïdes Generative Bionics. Objectif : injecter de la géométrie 3D explicite dans les pipelines Vision Language Action (VLA) et les world models qui font tourner les robots et la conduite autonome, en natif sur la stack open source AMD ROCm.
L’enjeu est clair. Les humanoïdes industrialisés en 2026 reposent presque tous sur des modèles VLA qui voient le monde en 2D, image après image. Résultat : ils trébuchent dès que la perspective change, qu’un objet est partiellement occulté ou que l’éclairage évolue. C’est exactement le terrain de jeu de Generative Bionics, qui déploie ses plateformes humanoïdes pleine taille dans des cas d’usage industriels et tape contre ce plafond depuis des mois.
L’Italie pousse une alternative européenne au stack Nvidia
La collaboration met en réseau trois acteurs italiens autour d’AMD. Le CVLab de Bologne, dirigé par Matteo Poggi, est une référence internationale en stereo vision et estimation de profondeur, avec un palmarès solide aux conférences CVPR, ICCV et ECCV. L’université de Modène et Reggio Emilia (UniMoRE) forme le second noeud académique du hub. Et Generative Bionics joue le rôle de partenaire industriel qui pousse les briques de recherche jusqu’au robot qui marche.
Niko Vuokko, directeur senior du développement logiciel chez AMD, résume la thèse : la prochaine vague de robots et de véhicules autonomes ne se contentera plus de classifier ou de générer. Elle devra construire une compréhension du monde en 3D, rester cohérente dans le temps et tenir sur des plateformes de calcul abordables. C’est le maillon que les VLA et les world models actuels n’ont pas encore.
L’architecture cible est précise. Le hub doit livrer trois briques : des backbones de perception « geometry-aware » intégrant stereo, profondeur, multi-vues, Bird Eye View et représentations 3D ; un entraînement et une inférence efficaces sur ROCm pour les pipelines BEV et point cloud ; et des modules d’évaluation orientés robotique et conduite autonome, en simulation et sur données réelles.
ROCm vs CUDA : l’écosystème AMD veut s’imposer en robotique
Le choix d’attaquer la robotique embodied AI est tactique. Nvidia domine outrageusement le stack avec Isaac Sim, Cosmos et la plateforme Jetson. AMD parie sur l’ouverture : tout le code produit par cette collaboration sera publié, intégré au World Models Foundry du Physical AI Program de Silo AI, et aligné sur l’EU AI Factory for Science. En clair, l’Europe avance ses pions dans la souveraineté IA en utilisant AMD comme cheval de Troie face au monopole Nvidia/CUDA.
Pour Generative Bionics, l’opération est un accélérateur. La société italienne reste discrète sur ses spécifications, mais le fait qu’AMD la pose en partenaire industriel principal du hub, aux côtés de DISI et UniMoRE, change sa visibilité. Elle rejoint un cercle restreint d’humanoïdiers européens crédibles, aux côtés du britannique Humanoid (HMND 01, partenariat Bosch annoncé hier) et de l’allemand 1X Technologies.
Concrètement, les modules co-conçus tourneront sur les GPU AMD Instinct série MI et les futures plateformes ROCm. Matteo Poggi promet de publier les briques en open source pour que la communauté puisse les améliorer. Si la promesse tient, AMD pourrait offrir aux laboratoires européens un chemin de moindre coût vers l’entraînement d’humanoïdes, là où les startups chinoises industrialisent déjà à 5 milliards de dollars de levées en quatre mois.
Source : Edge AI and Vision Alliance