La plupart des systèmes d’apprentissage profond sont conçus pour résoudre des problèmes spécifiques, tels que la reconnaissance d’animaux sur des photos du Serengeti ou la traduction de langues. Mais si vous prenez, par exemple, un algorithme de reconnaissance d’image et que vous l’entraîner pour qu’il puisse accomplir aussi une tâche complètement différente, comme la reconnaissance de la parole, alors ses performances sur son domaine d’expertise initial diminuent.
Les humains n’ont pas ce problème. Nous utilisons naturellement notre connaissance d’un problème pour résoudre de nouvelles tâches et n’oublions généralement pas une compétence acquise à mesure que nous en apprenons une nouvelle. Le réseau neuronal de Google vient de franchir une petite étape en ce sens, en apprenant simultanément à résoudre une gamme de problèmes différents sans se spécialiser dans un seul domaine.
Le réseau neuronal de Google Brain a appris à effectuer 8 tâches, y compris la reconnaissance de l’image et de la parole, la traduction et l’analyse des phrases. Le système, appelé MultiModel, se compose d’un réseau neuronal central entouré de sous-réseaux spécialisés dans des tâches spécifiques liées à l’audio, les images ou le texte.