De l’IA vocale open source pour les patients atteints de SLA (maladie de Charcot) à un collier intelligent pour victimes d’AVC, deux innovations récentes illustrent une nouvelle génération de technologies capables de redonner la voix à des patients en restaurant une communication fluide, expressive et digne.
Perdre la voix ne signifie pas seulement perdre un organe fonctionnel. C’est souvent perdre un accès direct aux autres, à la spontanéité du dialogue, à une part de son identité sociale. Depuis plusieurs décennies, la médecine et l’ingénierie ont tenté de répondre à cette rupture par une série de dispositifs aux logiques très différentes, allant de la simple substitution mécanique à des interfaces cerveau-machine de haute complexité.
Historiquement, les premières réponses ont été mécaniques. L’électrolarynx, appliqué sous le menton, fournit une source sonore externe que la bouche module, au prix d’un timbre métallique et monotone. Les prothèses trachéo-œsophagiennes, implantées après certaines chirurgies ORL, offrent une voix plus naturelle mais nécessitent un geste invasif et un suivi régulier. À côté de ces dispositifs, la parole œsophagienne repose sur une rééducation exigeante, sans appareillage, souvent limitée en intensité et en endurance vocale.
Pour les patients dont l’appareil phonatoire est intact mais dont la commande neurologique est atteinte, d’autres approches se sont imposées. Les interfaces cerveau-ordinateur cherchent à décoder l’intention de parole directement au niveau cortical, puis à la transformer en texte ou en voix de synthèse. Plus largement diffusées en clinique, les aides à la communication assistée par ordinateur — claviers virtuels, suivi oculaire, synthèse vocale — permettent de s’exprimer sans restaurer la voix au sens strict, au prix d’une communication souvent lente et fragmentée.
Une voix plus naturelle avec l’IA
C’est dans cet espace intermédiaire, entre haute technologie et usage réel, que s’inscrivent deux innovations récentes. La première est portée par Kyutai, avec le projet « Invincible Voice », conçu pour des personnes atteintes de sclérose latérale amyotrophique (maladie de Charcot).
L’approche ne cherche pas à décoder le cerveau ni à reconstruire l’appareil vocal, mais à restaurer une interaction fluide. Le système transcrit en temps réel la parole de l’interlocuteur, propose des réponses générées par un modèle de langage, puis restitue vocalement la réponse choisie par le patient. La voix de sortie conserve le timbre et les intonations de la personne grâce à quelques enregistrements réalisés avant la perte de la parole.
Compatible avec des dispositifs d’eye-tracking, l’ensemble peut être utilisé par des patients à mobilité extrêmement réduite. Le projet se distingue aussi par son choix de l’open source. L’architecture est modulaire et chaque brique — transcription, génération, synthèse — peut être améliorée ou remplacée. L’objectif est de permettre à des acteurs médicaux ou industriels de bâtir des outils certifiés à partir d’une base librement accessible.
Un collier pour les patients victimes d’AVC
La seconde innovation, développée à l’Université de Cambridge, s’adresse à des patients victimes d’AVC souffrant de dysarthrie. Baptisé Revoice, le dispositif prend la forme d’un collier souple porté autour du cou. Il capte les micro-vibrations des muscles de la gorge et des données physiologiques comme la fréquence cardiaque, puis les interprète grâce à deux systèmes d’IA. L’un reconstitue les mots à partir d’une articulation silencieuse, l’autre évalue l’état émotionnel et le contexte pour enrichir le message.
Contrairement aux aides lettre par lettre, Revoice génère des phrases complètes et expressives à partir de fragments de parole. Lors d’essais préliminaires menés sur un petit groupe de patients, le système a montré de faibles taux d’erreur et une nette augmentation de la satisfaction des utilisateurs. Les chercheurs soulignent toutefois la nécessité d’essais cliniques plus larges avant toute diffusion, avec l’ambition d’élargir ensuite la technologie à d’autres pathologies neurologiques.
Ces deux approches montrent que redonner une voix ne consiste plus seulement à produire un son, mais à restaurer une interaction humaine crédible, contextualisée et émotionnelle. Une évolution qui, pour de nombreux patients, changera radicalement le quotidien.