Création de jeux de données communautaires : observations des activités de Mozilla Common Voice en Afrique de l’Est

The report summarizes lessons-learnt and strategies of three voice communities used to create publicly available datasets. It is based on interviews with people driving these efforts, including Mozilla Fellows, community coordinators, contributors as well as supporting donor organizations.
Vue d’ensemble
Depuis 2019, la Fondation Mozilla collabore avec l’initiative FAIR Forward de GIZ pour promouvoir la création et l’utilisation de données et de technologies vocales ouvertes dans des langues d’Afrique de l’Est, notamment le kinyarwanda, le swahili et le luganda. Cela inclut le recueil de données vocales à grande échelle en collaboration avec les communautés locales à l’aide de la plateforme Mozilla Common Voice.
Ce rapport résume les enseignements tirés et les stratégies de trois communautés vocales qui ont servi à créer des jeux de données librement accessibles. Il repose sur des entretiens avec les personnes à l’origine de ces initiatives, notamment les bénéficiaires de bourses Mozilla, les coordinateurs de communautés, les contributeurs ainsi que des organisations qui apportent des financements.
Ces observations et recommandations visent à aider les communautés vocales existantes et futures, ainsi que les organisations qui les soutiennent, en leur fournissant des informations pratiques et concrètes sur les étapes techniques et les dynamiques sociales à l’œuvre lors de la création de jeux de données communautaires.