Common Voice

Common Voice is the most diverse open voice dataset in the world. Most voice datasets are owned by companies, which stifles innovation. They also under-represent almost every language in the world, as well as people of colour, disabled people, women and LGBTQIA+ people. We want to change that by mobilising people everywhere to share their voice.

Plataforma y conjunto de datos

Common Voice es el mayor conjunto de datos de voz multilingüe obtenidos mediante colaboración masiva.

Acerca de Common Voice

¿Por qué Common Voice?

La tecnología habilitada por voz es cada vez más omnipresente: desde los asistentes para teléfonos inteligentes y los dispositivos portátiles para cuidar la salud, hasta el software para practicar idiomas. Pero también está dejando a mucha gente rezagada. Los asistentes de voz actualmente reconocen menos del 1 % de los idiomas del mundo. Pero incluso si los reconocen, quizás no los entiendan, debido a que las comunidades con diversidad de géneros, las personas de color y lo acentos marginados o no nativos suelen estar subrepresentados en los datos para entrenar a la IA .

¡Queremos cambiar las cosas! Facilitando que gente como tú comparta su voz.

¿Cómo funciona Common Voice?

  • Primero: alguien pide que se agregue un idioma.
  • Segundo: el texto del sitio web es traducido a ese idioma por voluntarios.
  • Tercero: las frases se compilan para que personas las lean en voz alta.
  • Cuarto: lanzamos la plataforma Common Voice en ese idioma.
  • Quinto: personas acuden a aportar su voz.
  • Sexto: otras personas validan esos clips de voz.
  • Séptimo: liberamos el conjunto de datos cada 3 meses.
  • Octavo: ¡el ciclo se repite! ¡Más oraciones, más clips, más validaciones! ¡Siempre necesitamos tu ayuda!

¿Cómo puedo participar?

Gracias por preguntar. Revisa la plataforma para ver si tu idioma necesita más clips, más validaciones o más frases.

Si no te queda claro, anímate a ¡aportar algunos clips de voz! Solo toma un par de minutos hacer que la IA funcione mejor para todos.

Si quieres participar más de lleno, ¿qué te parecería ayudar a movilizar a la comunidad? Hay muchas maneras de hacerlo: desde ser un educador en temas de inclusión de la IA en Internet hasta organizando eventos locales en tu comunidad. Escríbenos y nosotros te pondremos en contacto con las personas adecuadas para que puedas ayudar.

Próximos pasos para la plataforma Common Voice

En cuanto a la experiencia de quienes aportan su voz, estamos trabajando para que la plataforma sea más fácil de usar en sitios donde el ancho de banda es reducido y para que los nuevos usuarios participen rápidamente. En lo referente a la arquitectura e infraestructura de la aplicación, estamos volviendo más escalable la plataforma y más segmentables los conjuntos de datos para quienes desean consumirlos.

El próximo año nos enfocaremos en algunas evoluciones de la plataforma que incluyen el habla espontánea. Si eres ingeniero o científico de datos y quieres ayudar, ¡ponte en contacto con nosotros!

Plataforma y conjunto de datos

Common Voice es el mayor conjunto de datos de voz multilingüe obtenidos mediante colaboración masiva.

Acerca de Common Voice

¿Por qué Common Voice?

La tecnología habilitada por voz es cada vez más omnipresente: desde los asistentes para teléfonos inteligentes y los dispositivos portátiles para cuidar la salud, hasta el software para practicar idiomas. Pero también está dejando a mucha gente rezagada. Los asistentes de voz actualmente reconocen menos del 1 % de los idiomas del mundo. Pero incluso si los reconocen, quizás no los entiendan, debido a que las comunidades con diversidad de géneros, las personas de color y lo acentos marginados o no nativos suelen estar subrepresentados en los datos para entrenar a la IA .

¡Queremos cambiar las cosas! Facilitando que gente como tú comparta su voz.

¿Cómo funciona Common Voice?

  • Primero: alguien pide que se agregue un idioma.
  • Segundo: el texto del sitio web es traducido a ese idioma por voluntarios.
  • Tercero: las frases se compilan para que personas las lean en voz alta.
  • Cuarto: lanzamos la plataforma Common Voice en ese idioma.
  • Quinto: personas acuden a aportar su voz.
  • Sexto: otras personas validan esos clips de voz.
  • Séptimo: liberamos el conjunto de datos cada 3 meses.
  • Octavo: ¡el ciclo se repite! ¡Más oraciones, más clips, más validaciones! ¡Siempre necesitamos tu ayuda!

¿Cómo puedo participar?

Gracias por preguntar. Revisa la plataforma para ver si tu idioma necesita más clips, más validaciones o más frases.

Si no te queda claro, anímate a ¡aportar algunos clips de voz! Solo toma un par de minutos hacer que la IA funcione mejor para todos.

Si quieres participar más de lleno, ¿qué te parecería ayudar a movilizar a la comunidad? Hay muchas maneras de hacerlo: desde ser un educador en temas de inclusión de la IA en Internet hasta organizando eventos locales en tu comunidad. Escríbenos y nosotros te pondremos en contacto con las personas adecuadas para que puedas ayudar.

Próximos pasos para la plataforma Common Voice

En cuanto a la experiencia de quienes aportan su voz, estamos trabajando para que la plataforma sea más fácil de usar en sitios donde el ancho de banda es reducido y para que los nuevos usuarios participen rápidamente. En lo referente a la arquitectura e infraestructura de la aplicación, estamos volviendo más escalable la plataforma y más segmentables los conjuntos de datos para quienes desean consumirlos.

El próximo año nos enfocaremos en algunas evoluciones de la plataforma que incluyen el habla espontánea. Si eres ingeniero o científico de datos y quieres ayudar, ¡ponte en contacto con nosotros!