Reconnaissance vocale
Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.
KDE intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur CMU Sphinx.
Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site Voxforge.org. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.
La synthèse vocale, qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.
Logiciels de reconnaissance vocale
Pour la commande vocale
- NoComprendo : commande vocale pour Linux
- Simon : permet de contrôler de multiples applications (firefox, rhythmbox, …) ainsi que le bureau aisément. Disponible https://sourceforge.net/projects/speech2text/
- VoiceExecute : permet de lancer des logiciels par la voix
- Google search sous Chrome : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
- Kalliope est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted.
- Lucida est un assistant personnel intelligent basé sur la parole et la vision inspiré par Sirius. Visitez le site Web pour le tutoriel, et Lucida-users pour de l'aide. Le projet est publié sous licence BSD, sauf pour certains sous-modules qui contiennent leurs propres licence.
- Jasper, pour raspberry
Pour la dictée vocale via une application
- Speech Note, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de Flatpak, vous pouvez l'installer via logiciel.
- X voice : utilise une librairie ViaVoice d'IBM qui est payante.
- Dragon Naturally Speaking : fonctionne moyennement sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface Platypus.
- FreeSpeech utilise les librairies pocketsphinx.
- VOSK : mode d'emploi pour transcrire un fichier audio par Tykayn
- LinSTT : service Speech-To-Text de l'assistant vocal LinTO
Dictée vocale en ligne
- SpeechNotes ou VoiceNotebook marchent dans Chrome/Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google.
- Google Docs : une fois un document créé ou ouvert, aller dans le menu Outils puis Saisie vocale
- Voice notebook : reconnaissance vocale via une application (multi plateforme), ou extension Chrome
Autres
- CMU Sphinx : Sphinx est une bibliothèque écrite en java et a une variante en C
- CommonVoice le projet de Mozilla (ex-DeepSpeech)
Logiciels dont le développement est arrêté :
- CVoiceControl : n'est plus soutenu par son créateur depuis 2002
Voir aussi
- Discussion "Reconnaissance vocale" sur le forum ubuntu-fr
- Synthèse vocale (Opération inverse)