Mozilla ha publicado recientemente la 7a versión de la base de datos con registros devoces en multiples idiomas, para entrenar un reconocedor de voz. La base de datos es CC0, así que se podrá usar en un futuro para entrenar cualquier algoritmo, independientemente de la licencia del mismo.
|
etiquetas: mozilla , common voice , dataset , reconocedor de voz
En están los enlaces para colaborar en distintos idiomas: commonvoice.mozilla.org/es/languages
Los más avanzados son inglés, ruandés, alemán, esperanto, catalán, francés y cabilío. El español todavía no llega a las 500 horas (el objetivo es conseguir 10.000 horas de cada idioma)
f-droid.org/packages/org.commonvoice.saverio