Grâce à l’apprentissage par renforcement, P1 se promène en forêt

Le robot bipède de la start-up chinoise LimX Dynamics, placé pour la première fois sur un terrain montagneux, s’y est déplacé avec aisance en intégrant des données avec l’apprentissage par renforcement.


La start-up chinoise de robotique LimX Dynamics vient de publier une vidéo de démonstration de son robot bipède P1. Le robot a été placé sur le mont Tanglang, proche de Shanghai, pour une expérimentation en zero shot : il découvrait le terrain pour la première fois. Cette initiative visait à évaluer la capacité du P1 à se déplacer sur un terrain accidenté nécessitant une vigilance constante.

Le P1 a su gravir des collines herbeuses, contourner des fossés, reprendre sa marche après un faux pas et maintenir sa stabilité après avoir été soumis à des chocs répétés. Le bâton du formateur se brise après avoir frappé les jambes du robot, témoignant de la robustesse de la machine.

L'apprentissage par renforcement appliqué au P1 n'a pas nécessité de données préalables concernant l'environnement de test. Contrairement aux méthodes traditionnelles d'apprentissage machine, qui dépendent de données étiquetées pour entraîner le logiciel, l'apprentissage par renforcement se base sur un jeu de récompenses et de pénalités pour permettre au système de prendre des décisions.

Cette approche a permis au robot de naviguer de manière autonome dans un terrain complexe, ce qui laisse présager des applications potentielles similaires pour le robot humanoïde CL-1 de LimX. Celui-ci a déjà montré qu’il sait monter des escaliers et se déplacer à l'intérieur comme à l'extérieur.

Pour en savoir plus :

L’essentiel