Chine : algorithmes ou données, qui joue le rôle le plus décisif ?

deep tech innovation NBIC IA biais
deep tech innovation NBIC IA biais
Image par Pexels de Pixabay

L. Bardon . – Si covid-19 a bien montré quelque chose, c’est que le « remède » miracle incarné par le big data n’en est pas un. La donnée en tant que telle n’a aucune utilité si on ne dispose pas d’une architecture adéquate pour stocker, structurer et analyser ces données. Plus une entreprise dispose de données qu’elle sait valoriser, meilleurs sont ses produits ; meilleurs sont ses produits, plus elle peut collecter de données ; plus elle collecte de données, plus elle attire les talents ; plus elle attire de talents, meilleur sont ses produits. C’est économiquement un cercle vertueux.

Les données sont vraiment importantes, mais dans quelle mesure ? Les données seront-elles plus importantes que les algorithmes ? Dans le domaine de l’apprentissage machine, qu’est-ce qui est le plus important : les données ou les algorithmes ? En fait, les algorithmes, la puissance de calcul et les données ont toujours été appelés la « trinité » de l’IA. Cette question semble être insoluble, comme de demander si la roue avant d’un vélo est plus importante que la roue arrière ? La jambe gauche est-elle plus importante que la jambe droite ? Toute partie de l’ensemble est indispensable pour mener à bien la tâche. De même, les données et les algorithmes sont également indispensables pour l’apprentissage machine.

1. Lequel confère les compétences plus compétitives ?

L’avantage des sociétés chinoises d’IA ne réside pas dans les algorithmes avancés mais dans les scénarios d’application riches et les grandes quantités de données étiquetées. Les nouvelles infrastructures se répandent maintenant dans toute la Chine. Des entreprises comme MBH fournissent non seulement des données annotées pour Megvii, Sensetime et d’autres, les aidant à devenir des sociétés d’IA mondialement connues, mais elles résolvent également un grand nombre de problèmes d’emploi—MBH emploie 300 000 personnes en Chine occidentale pour faire de l’étiquetage de données, et le salaire mensuel est de 3 000 RMB, ce qui est trois fois la norme minimale locale. Mais toutes les données ne sont pas comme le texte, l’image et la voix qui peuvent être envoyés à l’externalisation bon marché pour l’étiquetage. Par exemple, l’étiquetage des données de réseau exige des niveaux de connaissances extrêmement élevés, c’est pourquoi je n’ai pas saisi la tendance de l’IA basée sur la quantité d’un tas de données.

2. Si les données sont infinies, quand l’IA ne dépendra-t-elle plus des personnes ?

L’étiquetage des données atteindra-t-il un jour une limite ou sa fin ? Si l’étiquetage des données n’est jamais terminé, quand l’IA pourra-t-elle s’en passer ? En fait, les sociétés d’IA s’approchent de cette direction. Le concept d' »usine à algorithmes » a été lancé par le co-fondateur de Sensetime.

En 2015, SenseParrots a été lancé Sensetime et mis en service en interne, avec des fonctionnalités de pointe telles que la formation conjointe multi-machine, multi-cartes et l’exécution multi-chemin. À cette époque, le cadre technique open source de Google, TensorFlow, faisait fureur dans le domaine de l’IA. Après cinq ans de développement, « SenseParrots » est passé d’un cadre technique à une plate-forme de production de modèles de qualité industrielle, fournissant à Sensetime une technologie d’IA pour permettre à l’industrie de fournir un soutien solide. L’essence de la production d’algorithmes à grande échelle est de comprimer le coût de production d’un seul modèle d’algorithme, ce qui est très important pour toute société commerciale spécialisée dans l’IA.

Brain++ est la plateforme d’IA de Megvii. Sun Jian, scientifique en chef de Megvii et doyen de l’Institut de recherche de Megvii, a déclaré un jour « Megvii Brain++ rend possible l’entraînement d’algorithmes à grande échelle ». Megvii Brain++ peut être divisé en trois parties. Parmi elles, le cadre de développement d’algorithme d’apprentissage en profondeur en open source avec MegEngine au cœur, suivi de la plateforme d’apprentissage profond en nuage MegCompute qui fournit un support pour la programmation des calculs (note de Jeff : comme l’équilibrage de charge ou la programmation de hachage je pense), et MegData, qui est une plateforme de gestion de données pour soutenir les services de données.

3. Où se situe le point final de l’IA ?

Les frameworks d’algorithmes (fondamentaux) sont déjà courants, et la production à grande échelle d’un grand nombre d’algorithmes n’est plus difficile. Où se situe donc le point final de la recherche sur l’IA? « Une grande partie du savoir-faire en ingénierie ne se trouve pas dans les manuels ». Il y a donc un « voyage de mille lieues » entre l’université et l’ingénierie.

« La tendance que nous observons aujourd’hui dans le secteur commence par les frameworks (fondamentaux). Les systèmes informatiques et l’ensemble de la plate-forme M2M (machine to machine) nous posent de nombreux défis. Comment combiner l’intelligence artificielle et les données volumineuses ? Comment utiliser la technologie traditionnelle des compilateurs pour optimiser les calculs d’IA ? Ce sont les domaines dans lesquels nous devons investir davantage« . Jia Yangqing a déclaré dans une interview.

Ce sont les données qui déterminent la limite supérieure de la technologie. L’algorithme cherche à se rapprocher le plus possible de cette limite supérieure. De la technologie à la productivité, c’est le processus de réalisation de cette limite supérieure. Il nécessite une coopération et une correction de la rétroaction entre le côté technique et le côté produit.

L’université est une utopie dans la serre. Elle engendre de nouveaux pouvoirs et des possibilités illimitées, mais le lieu où la technologie peut vraiment mûrir et créer de la valeur est le monde réel, dans les champs, sur le site du projet, dans divers scénarios pratiques… C’est aussi la raison fondamentale pour laquelle la technologie de l’IA doit évoluer vers l’industrialisation.

La suite ici (四月)

(Visited 30 times, 1 visits today)
Avatar photo

Fondateur paris-singularity.fr👁️‍🗨️Entrepreneur social trackant les deep techs