AlphaGo de DeepMind : l’éclosion de l’IA non supervisée

Google photo
Photo by kenming_wang

Lorsque les chercheurs du laboratoire d’intelligence artificielle (IA) DeepMind de Google ont construit AlphaGo, le programme capable de jouer au jeu de Go mieux que personne avait encore besoin de l’assistance humaine. AlphaGo a appris à jouer à ce jeu extrêmement complexe en analysant environ 30 millions de mouvements effectués par des joueurs professionnels Go. Puis, une fois qu’AlphaGo a pu jouer au même niveau que l’humain, il a progressé extrêmement rapidement en jouant contre lui-même tout en étudiant de près les résultats de chaque mouvement. Finalement AlphaGo est peu de temps après parvenu à battre le grand maître coréen Lee Sedol, le meilleur joueur de ces dix dernières années.

Il y a environ un an, DeepMind a reconstruit entièrement son système. Et ce essentiellement sans assistance humaine. Les chercheurs ont continué de former AlphaGo en le faisant jouer à des jeux contre lui-même via des techniques d’AI permettant à l’algorithme d’apprendre de façon autonome. « AlphaGo est devenu son propre enseignant » explique David Silver.

Silver a dévoilé le nouveau design la semaine dernière à Wuzhen, en Chine, où AlphaGo jouait contre le meilleur joueur au monde, le grand maître Ke Jie, 19 ans. Demis Hassabis, fondateur et PDG de DeepMind, affirme que, maintenant que l’algorithme peut davantage apprendre seul, c’est-à-dire avec moins de données existantes, il est capable d’étendre son domaine de compétences au-delà du jeu de Go. AlphaGo pourrait aider à optimiser les réseaux électriques, dit-il, ou rationaliser les itinéraires de transport, ou accélérer la recherche scientifique.

En effet, les techniques qui sous-tendent AlphaGo, connues sous le nom de « deep reinforcement learning » (apprentissage par renforcement profond) sont devenues de plus en plus prégnantes dans le monde de la recherche sur l’IA. Mais le jeu de Go n’est pas le seul objectif. Après avoir construit ce que Hassabis appelle un système plus général, DeepMind pousse déjà la technologie vers de nouveaux secteurs. Selon Hassabis, le laboratoire commence à travailler avec le National Grid UK pour améliorer l’efficacité du réseau électrique britannique. L’IA DeepMind a réduit de 40% la facture du datacenter de Google. Pour ce faire, Hassabis et l’équipe ont créé une simulation de centres de données pour que l’IA puisse apprendre à contrôler plus efficacement les ventilateurs et autres matériels, tout comme AlphaGo apprend à jouer plus efficacement aujeu de Go. Seulement maintenant, l’échelle et les enjeux sont nettement plus importants.

La suite ici

(Visited 109 times, 1 visits today)
Avatar photo

Ingénieur en technologie de l'information, passionné par l'innovation et la singularité. Co-fondateur du think tank virtuel Paris Singularity.

2 commentaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *