Quel est la stratégie adoptée par les géants technologiques comme Google, Amazon et Uber pour optimiser leurs systèmes d’apprentissage machine ? Ils veulent injecter le plus de carburant possible dans les moteurs de leurs plates-formes ; soit un maximum de données. Beaucoup de données.
Plus précisément, ils voudraient tous gratuitement et librement accéder aux données financées par le secteur public – en arguant du fait que ce type de données continuera d’être ouvert par défaut et davantage structuré de manière à favoriser une utilisation plus large des données de recherche. Après tout, pourquoi payer pour acquérir des données lorsqu’il existe de vastes sources d’information financées par l’État ?
Les plateformistes suggèrent dans ce rapport de 125 pages publiés par la Royal Society (académie nationale des sciences du Royaume-Uni) d’autres pistes pour faire progresser l’apprentissage machine :
- De nouvelles normes pour les données libres (y compris les métadonnées)
- Un modèle d’étude de recherche qui a les «consentements les plus éthiques possibles» et un désir déclaré de repenser la notion de «consentement» en tant que base fondamentale de la bonne gouvernance des données.