Tuomas Sandholm et Noam Brown ont passé l’année dernière à concevoir Libratus, une IA capable de jouer au Texas Hold ‘Em, une version du jeu de poker classique qui permet d’effectuer n’importe quel pari à tout moment. Si les systèmes d’IA ont dominé les meilleurs joueurs aux échecs, aux échecs, à Othello, et même au jeu de Go, le Hold’Em sans limite constitue un obstacle différent. Contrairement à ces autres jeux, un joueur de poker ne perçoit qu’une partie de ce qu’il se passe à chaque main. Le poker est un jeu d’information imparfaite. Beaucoup de cartes sont cachées aux joueurs. Grâce à plus d’une décennie de recherches, Sandholm considère être sur le point d’avoir conçu un système qui pourrait finalement éclipser les humains de la compétition. Nous sommes certainement proches d’atteindre un point à partir duquel les machines battront les meilleurs humains aux jeux d’information imparfaite du type Texas Hold’Em. Pourquoi c’est important ? Parce que les capacités développées par l’IA au Texas Hold’em pourraient également s’avérer utiles dans dans d’autres domaines, comme les ventes aux enchères, et les marchés financiers, la sécurité physique, voir même la politique mondiale (lors de négociations très dures pour décider quoi faire lorsqu’on ne sait pas exactement ce que les autres personnes autour de la table feront).
Libratus a ommencé un match contre quatre des meilleurs joueurs de poker. L’IA est sortie vainqueur des deux premiers jours. Cette compétition a lieu jusqu’à la fin du mois.
DeepStack, une autre IA ayant le même objectif, est conçue selon une autre approche. L’IA construit aussi un arbre de jeu, mais elle n’étudie pas tous les scénarios. Au lieu de cela, Bowling et son équipe ont entraîné un réseau neuronal à deviner comment chaque jeu va se conclure. Si Facebook forme des réseaux neuronaux en les « nourrissant » de millions d’instantanés pour reconnaître les visages sur les photos, l’équipe de l’Alberta a formé ce réseau neuronal, DeepStack, en exploitant des milliers de situations de poker au hasard, en prenant en compte non seulement les cartes mais également les paris. De cette façon, le réseau neuronal apprend à reconnaître quels paris seront couronnés de succès. Il n’a ainsi pas besoin de déterminer tous les résultats possibles de chaque main.
3 commentaires