Qu’il s’agisse d’innovations révolutionnaires ou de visions ambitieuses, nos boursiers 2025 nous livrent leurs prévisions sur l’évolution de la technologie et son éventuel impact sur le monde.
Depuis longtemps, le discours autour de l’IA se résume soit à « Oh non, nous sommes tous condamnés », soit à « Ce n’est qu’avec l’IA que nous pourrons guérir le cancer ». Mais derrière ces deux discours se cachent les mêmes personnes, les mêmes entreprises et les mêmes intérêts. En 2025, nous, les journalistes, utiliserons les ensembles de données pour améliorer notre couverture de l’IA et demander des comptes aux parties prenantes de l’IA.
Permettez-moi d’être clair : nous, journalistes, n’avons pas fait un bon travail d’information sur l’IA et, plutôt que d’y faire face avec scepticisme, rigueur et curiosité, beaucoup d’entre nous ont été éblouis par cette technologie et ont choisi de reprendre le discours marketing, en la considérant comme un nouveau gadget génial. Le fait de tomber dans le panneau du battage médiatique ne nous a pas rendu service, ni à nous, ni à notre lectorat.
Par ailleurs, nous avons intégré l’expression « l’IA est un mystère ». Nous nous contentons de le dire, de lever les bras au ciel et de nous en aller. Mais nous pouvons faire mieux. Nous devons faire mieux si nous voulons que les systèmes d’IA et les entreprises qui les construisent soient tenus responsables de leur impact sur le monde.
S’il est vrai que les modèles sont non déterministes et inexplicables, les ensembles de données utilisés pour former ces systèmes ne le sont pas. Ces ensembles de données démontrent que l’IA n’est pas un mystère, mais un assemblage d’artefacts et de processus techniques différents. Elle est le résultat de choix et de valeurs et un produit de la culture dont elle est issue. Et lorsque nous examinons de plus près les ensembles de données utilisés pour former ces machines incroyablement complexes, nous identifions les modèles qui les alimentent et nous découvrons les effets émergents des systèmes algorithmiques.
Les grands reporters commencent déjà à enquêter sur les fondements des systèmes d’intelligence artificielle afin de comprendre comment ils sont fabriqués. Des journalistes ont montré que des vidéos YouTube (extraites sans le consentement de leurs créateurs) se retrouvent dans des ensembles de données d’entraînement de l’IA. Des communautés et des entreprises ayant produit de fausses images intimes non consensuelles ont été démasquées, et de la propagande nazie a été repérée dans des ensembles de données d’entraînement. Depuis plusieurs décennies, la méthode d’investigation s’est révélée être un outil puissant pour la transparence et la responsabilisation, pas seulement pour les journalistes. Il est temps d’appliquer cette méthode aux systèmes technologiques les plus complexes jamais conçus par l’homme.
L’étude des ensembles de données est une méthode permettant d’interroger de manière approfondie les systèmes d’IA : les données, les modèles et les effets. Ce n’est qu’en examinant des ensembles de données que l’on peut se faire une idée plus précise du fonctionnement des modèles d’IA et des lacunes, erreurs et préjugés qui peuvent en résulter.
En tant que journalistes, nous devons nous détacher de l’engouement actuel. Ce n’est qu’alors que nous pourrons comparer les avantages et les inconvénients de cette technologie, décider en connaissance de cause si, comment et pourquoi cette technologie serait utile pour nous ou notre lectorat, et faire un compte-rendu critique de l’IA et de ses effets.

Christo Buschek est boursier Mozilla 2025.
Qu’il s’agisse d’innovations révolutionnaires ou de visions ambitieuses, nos boursiers 2025 nous livrent leurs prévisions sur l’évolution de la technologie et son éventuel impact sur le monde.