Synthèse vocale libre : Mozilla et NVIDIA relancent le projet Common Voice

Common Voice, lancé par Mozilla en 2017, vise à développer une solution de reconnaissance vocale libre. La technologie évolue de manière spectaculaire et intéresse de nouveaux acteurs. NVIDIA a choisi d’investir 1,26 million d’euros dans le projet.

C’est quoi Common Voice ?

Common Voice de Mozilla est une initiative open source visant à démocratiser et à diversifier le développement de la technologie vocale. Lancé en 2017, le projet permet à quiconque de faire don de sa voix à une base de données gratuite et publique que les entreprises, les chercheurs et les développeurs peuvent utiliser pour former des applications, des produits et des services basés sur la voix.

Aujourd’hui, Common Voice représente le plus grand ensemble de données vocales multilingues du domaine public au monde, avec plus de 9.000 heures de données vocales dans 60 langues différentes, y compris des langues très répandues et d’autres moins utilisées comme le gallois et le kinyarwanda, qui est parlé au Rwanda. Plus de 164.000 personnes dans le monde ont contribué au projet jusqu’à présent.

La synthèse vocale, enjeu d’avenir

Selon plusieurs études, au cours de la prochaine décennie, la synthèse vocale devrait devenir le principal moyen d’interaction avec les appareils, qu’il s’agisse d’ordinateurs portables, de téléphones, d’assistants numériques ou de même de kiosques.

Problème identifié par Mozilla : les appareils à reconnaissance vocale d’aujourd’hui sont « inaccessibles à une grande partie de l’humanité car ils ne peuvent pas comprendre de vastes pans de langues, d’accents et de modes d’expression du monde entier« . Sans oublier que la plupart des données vocales actuellement utilisées pour entraîner les algorithmes d’apprentissage automatique sont détenues par une poignée de grandes entreprises, dont Apple, Microsoft et Google.

« Le langage est une partie importante de notre identité et les gens, et non les entreprises à but lucratif, sont les gardiens légitimes de la façon dont le langage apparaît dans nos vies numériques. En facilitant le don de données vocales, Common Voice permet aux gens de jouer un rôle direct dans la création de technologies qui aident l’humanité au lieu de lui nuire. » – Mark Surman, directeur exécutif de la Fondation.

Mozilla et NVIDIA autour de Common Voice

Voilà pourquoi Mozilla doit ranimer son projet Common Voice et a choisi de s’associer à NVIDIA, qui investit 1,5 million de dollars. Cet investissement permettra d’ »accélérer la croissance de l’ensemble des données de Common Voice, d’engager plus de communautés et de bénévoles dans le projet, mais aussi de soutenir l’embauche de nouveaux collaborateurs » au sein de l’entité.

« La demande en IA conversationnelle est croissante, avec des chatbots et des assistants virtuels qui ont un impact sur presque tous les secteurs. Avec les grands ensembles de données ouvertes de Common Voice, nous sommes capables de développer des modèles pré-entraînés et de les proposer gratuitement à la communauté. » – Kari Briski, senior director de NVIDIA

Ce qui change

Pour soutenir l’expansion, Common Voice fonctionnera désormais sous l’égide de la Fondation Mozilla dans le cadre de ses initiatives. Objectif fixé par NVIDIA et la Fondation : faire de Common Voice un « pionnier du don de données et un outil efficace que le public peut utiliser pour façonner l’avenir de la technologie » de manière éthique.

Comment conntribuer à Common Voice ?

Vous pouvez participer au projet en rejoignant la partie contributive du site web de Common Voice. Les informations du profil permettent d’améliorer la qualité des données audio et la précision de la reconnaissance vocale. Ces informations personnelles – démographiques notamment – restent toutefois anonymes.

Source toolinux.com