Bien que l’apprentissage de la marche et de la préhension soient relativement faciles pour beaucoup d’êtres vivants, les robots ont toujours beaucoup de difficultés à acquérir ces compétences. Enfin, jusqu’à maintenant. Un robot commence généralement sa vie en simulation. Lorsque son logiciel de guidage fonctionne bien dans le monde virtuel, il est placé dans un corps robotique, puis envoyé dans le monde physique. Là, le robot va inévitablement rencontrer des irrégularités illimitées et difficiles à prévoir dans l’environnement. Entre autres : le frottement de la surface, la flexibilité de la structure, les vibrations, les retards des capteurs et les actionneurs mal synchronisés… Malheureusement, la combinaison de ces nuisances est impossible à décrire complètement à l’avance à l’aide des mathématiques. Par conséquent, même un robot qui se débrouille très bien en simulation trébuchera et tombera après quelques rencontres avec des obstacles physiques apparemment mineurs.
Hwangbo et al. ont conçu une façon de combler cet écart de performance en combinant la théorie classique du contrôle avec des techniques d’apprentissage machine. L’équipe a commencé par concevoir un modèle mathématique conventionnel d’un robot quadrupède de taille moyenne appelé ANYmal. Elle a ensuite collecté les données des actionneurs qui guident les mouvements des membres du robot. Puis les chercheurs ont introduit cette information dans plusieurs réseaux neuronaux pour construire un second modèle, un modèle capable de prédire automatiquement les mouvements idiosyncrasiques des membres du robot AMYmal. Enfin, l’équipe a inséré les réseaux neuronaux formés dans son premier modèle et a exécuté le modèle hybride en simulation sur un ordinateur de bureau standard.
Les modèles hybrides sont le premier pas vers ce changement de stratégie d’apprentissage. La prochaine étape consistera à retirer complètement les modèles analytiques au profit de modèles d’apprentissage machine qui sont formés à l’aide de données recueillies dans le monde réel. De telles approches prennent de l’ampleur. Pour l’instant, les roboticiens apprennent encore à exploiter la puissance de calcul plus rapide, l’abondance des données des capteurs et l’amélioration de la qualité des algorithmes d’apprentissage machine.