Si sur le papier cette expérience va probablement fâcher des experts de l’IA, ce cas d’usage ne pourrait-il pas avoir permis la création de l’arrière grand-père de systèmes moins spécialisés capables de s’attaquer à des problèmes plus systémiques ? Des problèmes plus complexes que reconnaître la photo d’un chat ou battre un humain à un jeu vidéo.
L’inégalité des revenus est l’un des problèmes majeurs de l’économie. L’un des outils les plus efficaces dont disposent les décideurs politiques pour y remédier est la fiscalité : les gouvernements collectent l’argent des citoyens en fonction de leurs revenus et le redistribuent soit directement, par le biais des régimes de protection sociale, soit indirectement, en l’utilisant pour financer des projets publics. Mais si une plus grande imposition peut conduire à une plus grande égalité, une imposition excessive peut décourager les gens de travailler ou les motiver à trouver des moyens d’éviter de payer, ce qui réduit le pot global. Il n’est pas facile de trouver le bon équilibre. Les économistes s’appuient généralement sur des hypothèses difficiles à valider. Le comportement économique des gens est complexe, et il est difficile de recueillir des données à ce sujet. Des décennies de recherche économique se sont efforcées de concevoir la meilleure politique fiscale possible, mais le problème reste entier.
Des scientifiques de la société américaine de technologie commerciale Salesforce pensent que l’IA pourrait apporter sa pierre à l’édifice. Dirigée par Richard Socher, l’équipe a mis au point un système appelé AI Economist qui utilise l’apprentissage par renforcement – le même type de technique que celle qui est à la base des logiciels DeepMind AlphaGo et AlpahZero – pour identifier les politiques fiscales optimales pour une économie simulée. L’outil est encore relativement simple (il n’y a aucune chance qu’il puisse inclure toutes les complexités du monde réel ou du comportement humain), mais c’est un premier pas prometteur vers une évaluation des politiques d’une manière entièrement nouvelle.
Dans un des premiers résultats, le système d’IA a trouvé une politique qui, en termes de maximisation de la productivité et de l’égalité des revenus, était 16 % plus juste qu’un cadre fiscal progressif de pointe étudié par les économistes universitaires.
Dans la simulation, quatre agents virtuels sont contrôlés par leurs propres modèles de renforcement et d’apprentissage. Ils interagissent avec un monde bidimensionnel, ramassant du bois et de la pierre et échangeant ces ressources avec d’autres ou les utilisant pour construire des maisons, ce qui leur permet de gagner de l’argent. Les travailleurs ont différents niveaux de compétences, ce qui les amène à se spécialiser. Les travailleurs peu qualifiés apprennent qu’ils sont plus performants s’ils collectent des ressources, et les plus qualifiés apprennent qu’ils sont plus performants s’ils achètent des ressources pour construire des maisons. À la fin de chaque année simulée, tous les travailleurs sont imposés à un taux conçu par un responsable politique contrôlé par l’IA, qui utilise son propre algorithme d’apprentissage par renforcement. L’objectif du responsable politique est d’augmenter la productivité et les revenus de tous les travailleurs. Les IA convergent vers un comportement optimal en répétant la simulation des millions de fois.
Les deux modèles d’apprentissage par renforcement partent de zéro, sans aucune connaissance préalable de la théorie économique, et apprennent à agir par essais et erreurs sans intervention humain. La double dose d’IA est la clé. Les réseaux neuronaux ont déjà été utilisés pour contrôler des agents dans des économies simulées. Mais en faisant du décideur une IA également, on obtient un modèle dans lequel les travailleurs et le décideur s’adaptent continuellement aux actions de l’autre. Cet environnement dynamique a constitué un défi pour les modèles d’apprentissage par renforcement, car une stratégie apprise dans le cadre d’une politique fiscale peut ne pas fonctionner aussi bien dans le cadre d’une autre. Mais cela signifiait également que les institutions d’aide ont trouvé des moyens de jouer avec le système.
Pour voir si la politique fiscale générée par l’IA influencerait le comportement humain de la même manière, l’équipe l’a testée sur plus de 100 travailleurs embauchés via Mechanical Turk d’Amazon à qui il a été demandé de prendre le contrôle des travailleurs dans la simulation. Ils ont découvert que la politique encourageait les humains à jouer à peu près de la même manière que les IA, suggérant – au moins en principe – que l’AI Economist pouvait être utilisée pour influencer l’activité économique réelle.
La suite ici (Will Douglas Heaven)