
Stefan Baack
Dernières recherches
-
Towards Best Practices for Open Datasets for LLM Training
13 janvier 2025Openness and AI / AI fairness, accountability, and transparencyBuilding on community insights from 30 AI dataset experts, this research paper distills best practices for creating open datasets for LLM training. The paper is a collaboration between Mozilla and EleutherAI.
-
Training Data for the Price of a Sandwich: Common Crawl’s Impact on Generative AI
6 février 2024AI bias & discrimination / AI fairness, accountability, and transparencyMozilla finds that Common Crawl's outsized role in the generative AI boom has improved transparency and competition, but is also contributing to biased and opaque generative AI models.
-
Bulletin de santé d’Internet 2022
18 juillet 2022Santé d’Internet / Bulletin de santé d’Internet / Équité, responsabilité et transparence de l’IAUne compilation annuelle de recherches et d’articles expliquant les clés d’un Internet plus sain. Dans cette édition, nous limitons notre attention à l’intelligence artificielle.