Murs capitonnés, éclairage sombre et plafond tapissé de papier peint floral. Grâce à cds simulations remplies de couloirs étroits, Demis Hassabis pense qu’il peut construire les bases d’un logiciel assez intelligent pour résoudre les plus grands problèmes de l’humanité. Cette étape est supposée n’être qu’un point de passage dans ce que Hassabis décrit comme le programme Apollo de l’intelligence artificielle. Hassabis veut créer une intelligence artificielle généralisée dite « forte », capable d’appréhender n’importe quel sujet ou n’importe quelle tâche. Selon lui une telle intelligence nous permettrait, par exemple, de faire progresser la médecine en formulant et en testant les théories scientifiques à la volée. Mais pour arriver à un tel niveau, l’intelligence artificielle doit d’abord se familiariser avec le monde réel ou du moins avec un monde virtuel qui s’en rapproche.
Le monde recréé par DeepMind s’appelle Labyrinth. AlphaGo y effectue des tâches de plus en plus complexes. L’intelligence artificielle faible explore un labyrinthe au sein duquel il gagne des points à chaque fois qu’il trouve la sortie ou collecte des pommes. AlphaGo est confronté à des défis de plus en plus complexes. DeepMind envisage de faire ensuite de son algorithme un champion de Starcraft et même de Poker. Selon Hassabis, il manque à AlphaGo une compétence essentielle, ce qui permet aux cerveaux humain et animal de faire face à la complexité du monde réel, ce qu’on appelle le « chunking ». Pour l’illustrer Hassabis utilise un exemple : imaginez que vous ayiez besoin d’aller à l’aéroport. Vous pouvez prévoir tout votre trajet sans avoir besoin de savoir exactement en amont où vous aller précisément positionner vos pieds, comment vous allez tourner la poignée ou contrôler chaque secousse de vos fibres musculaires. Des centaines de milliers d’année d’évolution nous permettent de manipuler des concepts de haut niveau sans réellement avoir à y penser en détail.