Les superordinateurs remplissent généralement des pièces entières. Mais celui du 5e étage d’un immeuble au centre de Bristol qui tient dans un tiroir de taille moyenne. La performance de ses 16 processeurs dépasse les 1 600 téraflops, ce qui place la machine parmi les 100 plus rapides au monde, au moins pour la résolution de certaines applications d’intelligence artificielle (IA), comme la reconnaissance de la parole et des images. Après des décennies au cours desquelles l’industrie des semi-conducteurs a été régie par des grandes entreprises comme Intel en Amérique et ARM en Grande-Bretagne, la demande induite par l’IA crée une ouverture pour les nouveaux venus comme la startup Graphcore. Et elle peut même être assez importante pour permettre à certaines startups de se développer et devenir des acteurs majeurs. New Street estime que le marché des puces dédiées à l’IA pourrait atteindre 30 milliards de dollars d’ici 2022. Cela dépasserait les 22 milliards de dollars de revenus qu’Intel devrait tirer cette année de la vente de processeurs. Selon les auteurs d’un récent rapport d’UBS, une banque d’investissement, le marché pourrait être encore plus important. Ils estiment que les processeurs spécialisés dans l’IA créeront leur propre demande. Ils permettent aux entreprises de développer des services et des dispositifs plus intelligents, qui collecteront encore plus de données, autoalimentant ainsi le besoin de puces encore plus intelligentes.
Graphcore a conçu une unité de traitement intelligent (IPU). Ce terme n’est pas seulement marketing. Sur les GPU standards, la mémoire (la zone où sont stockées les données) et le « cerveau » (où elles sont traitées) sont deux zones séparées. Les données doivent donc constamment être véhiculées entre les deux zones, ce qui crée un goulot d’étranglement pour les applications d’IA gourmandes en données. Pour diminuer cette contrainte forte, les puces de Graphcore disposent de centaines de mini-cerveaux ; mais surtout la mémoire est placée juste à côté, minimisant ainsi le trafic de données. La puce de Graphcore peut aussi contenir des réseaux neuronaux entiers et des modèles de calcul inspirés des structures du cerveau biologique utilisés dans de nombreuses applications d’IA.
Cerebras va plus loin encore. Il ne s’agit pas seulement de concevoir un nouveau processeur, qui est similaire à celui de Graphcore, mais un ordinateur spécialisé dans l’IA.