Jeu de données de RegretsReporter
Le jeu de données RegretsReporter permet aux internautes du monde entier de mener leurs propres recherches sur l’algorithme de recommandation de YouTube. Ces données ont déjà été à l’origine de recherches percutantes de Mozilla qui ont façonné des politiques publiques et conduit YouTube à publier plus d’informations sur le fonctionnement de son algorithme. En mettant les données anonymes de RegretsReporter à la disposition d’un plus grand nombre de chercheurs, d’enquêteurs et de journalistes dans le monde, nous pouvons continuer à surveiller l’impact de l’algorithme de recommandation de YouTube sur les communautés locales et aider à mettre YouTube face à ses responsabilités.
En savoir plus sur nos travaux avec YouTube RegretsReporter.
FAQ
Qu’est-ce que RegretsReporter ?
RegretsReporter est une extension de navigateur qui a permis de lancer la plus grande enquête participative au monde sur le système de recommandation de YouTube. Le système de recommandation de YouTube est l’un des plus grands systèmes d’IA au monde, et pourtant très peu d’informations sur son fonctionnement ou sur le type de vidéos qu’il propose sont disponibles. À ce jour, plus de 60 000 personnes originaires de 191 pays ont installé RegretsReporter pour faire don de leurs données YouTube à des chercheurs de Mozilla qui militent pour des systèmes d’IA plus dignes de confiance. Ces données ont aidé les chercheurs de Mozilla à découvrir de dangereux défauts dans le système de recommandation de YouTube. Des défauts que les décideurs politiques européens et américains ont depuis lors pris en compte.
Que contient le jeu de données ?
Le jeu de données comprend des informations à propos des vidéos que les personnes interrogées ont « regretté » (dans notre première étude) ou cliqué sur « Ne pas recommander » (dans notre deuxième étude). Dans les deux cas, nos participant·e·s considèrent que cet ensemble de vidéos représente du contenu indésirable. Dans le cadre de notre deuxième étude, nous avons également publié l’ensemble des vidéos qui ont été recommandées aux participant·e·s. Le jeu de données contient également des données du projet Viu Politica, un projet de recherches sur la propagande politique sur YouTube au Brésil menées conjointement par l’université d’Exeter et l’institut Vero.
Pourquoi publiez-vous les données ?
Nous publions les données de RegretsReporter afin qu’un plus grand nombre d’utilisateurs et d’utilisatrices puissent s’informer sur le système de recommandation de YouTube et sur l’impact qu’il peut avoir sur leur communauté. Notre objectif est de favoriser une transparence accrue en ce qui concerne les systèmes d’IA, ce qui peut entraîner davantage de responsabilisation face aux préjudices et, en fin de compte, à une mise sur le marché de produits plus sûrs et dignes de confiance. Nous pensons que ces données, qui sont anonymes et ne contiennent aucune information permettant de vous identifier, seront précieuses pour les chercheurs indépendants, les journalistes et les experts en technologie responsables qui travaillent à la concrétisation de cette vision.
Qui peut accéder à ces données ?
Les données sont accessibles à tout le monde, elles sont publiées sous licence cc0-1.0.
Quels sont les usages possibles avec ces données ?
Le jeu de données RegretsReporter peut être utilisé pour les enquêtes et les recherches sur les vidéos YouTube que la communauté des bénévoles de RegretsReporter trouve inacceptables, offensantes ou dangereuses. Par exemple, l’enquête de Mozilla qui a utilisé ces données a révélé que l’algorithme de YouTube recommandait des vidéos comportant de la désinformation, des contenus violents, des propos haineux et des escroqueries, et que les personnes dans les pays non anglophones sont bien plus susceptibles de voir ces vidéos que d’autres. Étant donné que ce jeu de données comprend des données de personnes originaires de plus de 191 pays, y compris des données collectées spécifiquement pour un projet de recherche sur la propagande politique au Brésil, nous pensons qu’elles pourraient être analysées par des chercheurs et chercheuses avec un contexte plus localisé pour produire des recherches percutantes. De plus, les données de recommandations contenues dans le jeu de données peuvent être utilisées pour étudier le comportement du moteur de recommandations de YouTube au fil du temps.
Comment protégez-vous la vie privée des individus ?
Les données partagées ne sont pas liées aux participant·e·s qui ont contribué, il s’agit uniquement d’informations sur les vidéos, la date à laquelle elles ont été regrettées ou recommandées, et le pays dans lequel l’activité a eu lieu.
Pouvez-vous aider les chercheurs et chercheuses qui souhaitent utiliser ces données ?
Notre équipe a des capacités limitées pour fournir une assistance individualisée aux personnes et aux équipes qui souhaitent utiliser les données de RegretsReporter, mais nous nous ferons un plaisir de vous aider lorsque nous le pourrons. Veuillez consulter nos données techniques détaillées pour plus d’informations sur le jeu de données et la façon de l’utiliser. Si vous avez une demande plus spécifique, veuillez envoyer un bref e-mail à l’adresse [email protected] en nous indiquant qui vous êtes et ce que vous souhaitez faire des données de RegretsReporter. Nous vous contacterons si nous pouvons répondre à votre demande.
Vous avez des questions ? Contactez-nous via [email protected].