Le robot-chien qui imitait… les chiens (et les chevaux)

Capture d’écran 2024-12-18 105048

Un nouveau cadre d'apprentissage par renforcement profond inspiré des robots quadrupèdes à imiter les stratégies de locomotion des animaux, permettant des déplacements stables et adaptatifs sur des terrains variés sans capteurs supplémentaires ni entraînement spécifique.

Des chercheurs des universités de Leeds et de l'University College London ont développé un modèle bio-inspiré qui exploite les mécanismes naturels de locomotion des quadrupèdes, intégrant des attributs comme la sélection stratégique des allures, la mémoire procédurale des mouvements, et des ajustements en temps réel. Contrairement aux approches classiques qui s'appuient sur une seule stratégie de déplacement, ce cadre novateur reproduit la diversité des allures observées chez les animaux : trottinement pour les terrains irréguliers, course sur des surfaces homogènes et saut dans des conditions plus complexes, comme des zones glissantes.

La locomotion animale, façonnée par des facteurs biologiques et environnementaux, repose sur une transition fluide entre différentes allures pour optimiser l'efficacité énergétique et la coordination musculaire. Les systèmes robotiques traditionnels, désormais robustes et capables de récupérer après des perturbations, sont limités par l'absence d'une telle flexibilité. Ce nouveau cadre bio-inspiré cherche à combler cette lacune, en adaptant les principes de la biomécanique animale à la robotique.

Un cadre sans capteurs supplémentaires

Au cœur de cette innovation se trouve un planificateur de démarche bio-inspiré, appelé "Bio-inspired Gait Scheduler" (BGS), qui aide le robot à mémoriser et adapter ses mouvements. Il génère notamment un paramètre de sortie, nommé βL, qui définit l'état de contact de référence de chaque pied et leur position cartésienne de référence dans le repère mondial. Ce paramètre permet au robot de s’ajuster en temps réel et de rester stable, même sans utiliser de capteurs sophistiqués.

Les essais ont montré que cette approche réduit fortement les risques de déséquilibre, en jouant un rôle similaire à celui du cervelet chez les animaux, qui coordonne leurs mouvements pour maintenir leur stabilité.

Un autre élément clé du cadre, appelé πuniG, optimise les stratégies de sélection des démarches, permettant au robot de réagir aux changements structurels ou de friction du terrain. Ce système ne nécessite pas d'entraînement spécifique sur des terrains difficiles ni de capteurs lourds en ressources, mais utilise des ajustements auxiliaires pour éviter les échecs. Cette approche reflète les transitions d’allures naturelles chez les animaux, qui ne sont pas ciblées de manière explicite pendant l’entraînement.

Des résultats prometteurs sur des terrains variés

Lors des expérimentations, les robots équipés de ce cadre ont démontré une capacité à traverser des terrains complexes, allant des surfaces déformables aux obstacles imprévisibles, avec une stabilité remarquable. Cette performance s'inscrit dans un contexte de "zero-shot deployment", où le robot est capable de s'adapter immédiatement à un environnement inconnu, sans apprentissage préalable. Par exemple, là où les robots basés sur la vision échouent face à des obstacles soudains ou des changements de texture, ce système maintient la stabilité grâce à des mécanismes internes d'ajustement.

En outre, les chercheurs ont observé que les forces structurelles exercées par les actionneurs fournissent des indices sur l'instabilité, remettant en question les interprétations qui excluaient ces métriques.

Pour en savoir plus :

L’essentiel