La startup chinoise Spirit AI a déclaré que son modèle de base d'intelligence incarnée Spirit v1.5 se classe désormais au premier rang selon le benchmark de robotique du monde réel RoboChallenge, dépassant un modèle américain de premier plan.
Selon le classement RoboChallenge, Spirit v1.5 a obtenu un score total de 66,09 avec un taux de réussite des tâches de 50,33 %, surpassant le modèle pi0.5 développé par la société américaine Physical Intelligence.
Spirit AI a déclaré avoir mis en open source le modèle leader et les ressources associées.
RoboChallenge, que les observateurs du secteur décrivent souvent comme un « examen mondial » pour les robots, est une plateforme d'évaluation de machines réelles qui teste des modèles d'intelligence incarnée dans des environnements physiques. Son processus d'analyse comparative comprend 30 tâches couvrant les opérations quotidiennes telles que le placement d'objets, la reconnaissance de cibles et l'utilisation d'outils.
En plus d'avoir obtenu le score global le plus élevé sur la plateforme, Spirit v1.5 était également le seul modèle à atteindre un taux de réussite supérieur à 50 %, selon les résultats accessibles au public.
L'entreprise a été fondée à Hangzhou, la capitale de la province du Zhejiang, dans l'est de la Chine, qui abrite également la start-up d'IA DeepSeek et la société de robotique humanoïde Unitree Robotics. Il se concentre sur la recherche en intelligence incorporée et en robotique. En juin 2025, l'entreprise a dévoilé son robot humanoïde Moz1, ciblant les applications d'entreprise telles que les scénarios logistiques et industriels.
Qiu Jiefan, professeur agrégé à l'Université de technologie du Zhejiang, a déclaré que le premier classement suggère que Spirit v1.5 a démontré de solides capacités globales dans les tâches robotiques générales et l'exécution dans le monde réel.
« Pour l'intelligence incorporée, la capacité de comprendre et d'exécuter plusieurs tâches et scénarios est très importante », a déclaré Qiu, notant que même si la technologie n'est pas encore prête pour un déploiement à grande échelle, ce dernier résultat marque une étape importante vers une application pratique.
Han Fengtao, fondateur et PDG de Spirit AI, a déclaré que Spirit v1.5 dispose d'une architecture Vision-Langage-Action (VLA) unifiée qui intègre la perception, le raisonnement et l'action dans un système de bout en bout, réduisant ainsi les erreurs associées aux approches modulaires établies. Il a déclaré que la société s'attend à ce qu'une gamme plus large de robots de service émerge au cours des deux à trois prochaines années.
Source(s) : Agence de presse Xinhua
