Reconnaissance vocale

portail, accessibilité, audio, multimédia

Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.

KDE intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur CMU Sphinx.

Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site Voxforge.org. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.

La synthèse vocale, qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.

Pour la commande vocale

NoComprendo : commande vocale pour Linux
Perlbox : permet de commander l'environnement KDE par la voix. Basé sur Sphinx.
Simon : permet de contrôler de multiples applications (firefox, rhythmbox, …) ainsi que le bureau aisément. Disponible https://sourceforge.net/projects/speech2text/
VoiceExecute : permet de lancer des logiciels par la voix
Google search sous Chrome : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
Kalliope est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted.
Lucida est un assistant personnel intelligent basé sur la parole et la vision inspiré par Sirius. Visitez le site Web pour le tutoriel, et Lucida-users pour de l'aide. Le projet est publié sous licence BSD, sauf pour certains sous-modules qui contiennent leurs propres licence.
Jasper, pour raspberry

Pour la dictée vocale via une application

Speech Note, est une application qui permet de convertir ce que vous dictez en texte. Elle est présente dans les dépôts sous forme de Flatpak, vous pouvez l'installer via logiciel.
X voice : utilise une librairie ViaVoice d'IBM qui est payante.
Dragon Naturally Speaking : fonctionne moyennement sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface Platypus.
FreeSpeech utilise les librairies pocketsphinx.
VOSK : mode d'emploi pour transcrire un fichier audio par Tykayn
LinSTT : service Speech-To-Text de l'assistant vocal LinTO

Dictée vocale en ligne

SpeechNotes ou VoiceNotebook marchent dans Chrome/Chromium (pas dans Firefox). Non libres. Basés sur le moteur de Google.
Google Docs : une fois un document créé ou ouvert, aller dans le menu Outils puis Saisie vocale
Voice notebook : reconnaissance vocale via une application (multi plateforme), ou extension Chrome

Autres

CMU Sphinx : Sphinx est une bibliothèque écrite en java et a une variante en C
CommonVoice le projet de Mozilla (ex-DeepSpeech)

Logiciels dont le développement est arrêté :

CVoiceControl : n'est plus soutenu par son créateur depuis 2002

Discussion "Reconnaissance vocale" sur le forum ubuntu-fr
Synthèse vocale (Opération inverse)

Page
CMU Sphinx
NoComprendo
Perlbox
Simon (speech2text)

Reconnaissance vocale

Logiciels de reconnaissance vocale

Pour la commande vocale

Pour la dictée vocale via une application

Dictée vocale en ligne

Autres

Voir aussi

Pages en rapport