Synthese de la Parolede PROMOTIC| JobPaw.com

Synthese de la Parole


Quelles sont les applications de la synthèse de la parole ?
La synthèse de la parole, technologie issue du traitement automatique de la parole, fait partie des interfaces vocales entre les hommes et les systèmes électroniques. Elle est devenue incontournable dans cette société de l’information où servir le client à distance est un enjeu majeur. Quelles sont les techniques de la synthèse vocale ? Quelles sont les applications de la synthèse vocale ?

Mise en contexte
La synthèse de la parole est l’ensemble des dispositifs, matériels ou algorithmes, pour générer automatiquement de la parole artificielle. La synthèse de la parole consiste en la lecture par une voix synthétique d’un texte numérique.1

En d’autres termes, la synthèse de la parole ou synthèse vocale ou encore TTS (text to speech) est une technologie utilisant une synthèse sonore pour permettre de lire un texte avec une voix artificielle. La synthèse de la parole cherche à reproduire une voie humaine à partir d’une combinaison de mots disponibles.2
Il y a plusieurs types de synthèse vocale. La plus complète est la synthèse à partir de texte (text to speech) où le but est de produire de la parole à partir d’un texte à priori inconnu.2
En fait, c’est un logiciel qui peut lire un texte écrit avec une voix synthétique. La synthèse vocale n’est pas uniquement un ensemble de sons pré- enregistrés.
Il existe 5 grandes étapes dans le développement de la synthèse de la parole.
• La modélisation du conduit vocal
• La synthèse par règles ou par formants
• La synthèse par concaténation mot à mot
• La synthèse par concaténation de diphtongues
• La synthèse par sélection d’unités dans une grande base de données
La synthèse de la parole peut être facilement comprise en considérant le cas d’un abonne de la Haitel qui veut connaitre le montant de crédit disponible sur son téléphone (la balance de son compte). Il compose le numéro court 151, et une voix lui répond et lui propose plusieurs options. En choisissant de connaitre la balance de son compte, une « voix » lit les données de son compte dans le système et les répète pour le client. On peut entendre par exemple que « la balance de votre compte est 301 gourdes et 65 centimes ». Ce n’est pas un employé qui fait ce travail, c’est bien la synthèse vocale. Le logiciel a appris à lire le texte français qui dans le système pour qu’il puisse le lire au besoin pour les clients. On peut comprendre qu’il n’est pas possible d’embaucher des milliers d’employés pour répondre aux demandes de balance de compte d’une compagnie de 10 millions d’abonnés. Cette technologie facilite la vie aux gens qui ne savent pas lire, donc ils peuvent entendre la balance.
D’autres technologies utilisées dans d’autres compagnies fournissent une réponse en message textuel au client. Mais les deux systèmes cohabitent, Haitel exploite les deux simultanément.
Types de synthèse
Il existe différents types de synthèses.
• Synthèse à partir de courtes phrases pré –enregistrées
• Synthèse à partir de lecture du texte

Techniques des synthèses vocales
Les techniques exploitées dans la synthèse vocale sont la numérisation du son, l’informatique et le traitement numérique du son. Pour la synthèse du texte, on exploite les techniques de traitement automatique de la langue : techniques d’analyse syntaxique automatique, de phonetisation automatique. Les techniques de traitement du signal sont également utilisées.

Réalisations de la synthèse vocale
Pour qu’un système de synthèse vocale fonctionne, il ya un ensemble d’étapes de traitement à réaliser.
La réalisation de synthèse à partir de textes pré –enregistrés est relativement facile.
Quand il s’agit de faire lire du texte, il faut d’abord mettre le texte sous forme numérique. Il faut ensuite repérer les anomalies (sigles, chiffres, unités) du texte qui peuvent confondre la machine ; par exemple il faut clarifier pour la machine quand la lettre « g » doit être prononcée comme gourde ou gramme. Le calcul de la prononciation du texte est essentiel, il y a une différence entre la façon dont le texte est écrit et la façon dont il sera prononcé. Cette étape est la phonétisation, ou transcription du texte orthographique sous forme de texte phonétique. Une autre étape est la prosodie, c'est-à-dire, la structure du texte, le type de musique qui doit être associée au texte, le moment d’ouvrir ou de fermer la musique et le choix de la mélodie, des rythmes et nuances, etc. Et la dernière étape qui consiste en la fabrication de la parole synthétique. A ce niveau là, il faut aller chercher dans les bases de données les segments de parole qui doivent être assemblés, puis modifiés, adaptés et finalement assemblés à nouveau pour constituer un signal acoustique.

Applications de la synthèse vocale
Les principales applications de la synthèse vocale sont :
Dans les jeux, l’électroménager, les transports, etc. des messages courts peuvent être fournis par le système de synthèse « La porte du frigo est ouverte » ou la poupée qui dit « habille-moi.»
Dans les services d’annonces vocales (services de météo, services d’annonces, etc.). La synthèse vocale est utilisée pour lancer des messages au besoin. Ces messages sont déjà disponibles dans le système, le logiciel ne fait que lire suivant les conditions prédéfinies.
D’autres applications concernent les services de réponse mis en place par les systèmes de vente. Une compagnie peut se servir de synthèse vocale pour communiquer des informations sur leurs catalogues de services et de produits.
La vocalisation (la mise sous forme vocale) d’écrans informatiques pour les malvoyants grâce à un logiciel appelé lecteur d’écran (screen readers). Ceci permet aux malvoyants d’entendre (le contenu des écrans) et de réagir convenablement avec le système informatique et le logiciel.
Des applications de synthèse de la parole sont installées dans les serveurs vocaux téléphoniques. Elles fournissent aux usagers de téléphones portables des informations vocales sur la balance de leurs comptes et leur permettent d’accéder à d’autres informations.
La synthèse vocale a également une application dans les outils d’enseignement assistés par ordinateur.
Elle est utilisée dans l’apprentissage des langages dans le domaine des répondeurs vocaux ou encore les jeux vidéo.
D’autres applications comprennent la lecture de courriers électroniques et de télécopie (fax), la fourniture de sorties vocales pour tout type d’informations présente dans une base de données ou dans une interface et lectures de livres et de sites web. C’est également le cas pour les personnes qui écoutent au volant de leur voiture la lecture de leurs journaux ou de leurs messages.

Avantages de la synthèse vocale
La synthèse de la parole comporte plusieurs avantages.
Les malvoyants se voient offrir un outil capable de répondre à leurs demandes
Pour le client, la possibilité d’être servi à n’importe quel moment du jour et sans ligne d’attente comme dans les services à la clientèle traditionnelle. Le client peut répéter ses demandes autant de fois sans déranger. Elle facilite la vie aux clients ne pouvant pas lire.
Pour l’operateur de service, c’est un service à la clientèle virtuel. Il n’est pas nécessaire d’employer un personnel pléthorique pour servir la clientèle et coûte moins cher.
Il a la garantie de servir les clients avec satisfaction en exploitant la technologie

Défis de la synthèse vocale
• Les défis de la synthèse vocale sont entre autres :
• L’intelligibilité : comment garantir une compréhension complète de ce qui est dit
• Le naturel : la parole artificielle doit être la plus naturelle possible
• Lecture de nouveaux mots : Dans certains textes, comme les journaux, la rencontre de nouveaux mots reste un enjeu de taille pour le logiciel qui doit les lire.

Conclusion
La synthèse vocale, élément à la base de la communication machine – homme joue un rôle de premier plan dans le monde technologique d’aujourd’hui. Cette passerelle entre l’écrit et l’oral a contribué au succès de nombreuses entreprises et a facilité la vie aux personnes malvoyantes. Elle aide également à combattre l’illettrisme. Par la comparaison avec la voix humaine, la synthèse de la parole comporte certains dangers. Au niveau de l’identification de la personne par sa voix, il y a risque d’utiliser la voix d’une autre personne pour identifier une personne donnée.
L’usurpation d’identification est un autre danger de cette technologie.
Si le naturel tant recherché dans cette technologie se concrétise, elle peut constituer une sorte de substitution de la machine à l’homme.

Références
1.- Synthese vocale
http://recit.csbe.qc.ca/reapo/attachments/049_notes%20WordQ-DSPierre.pdf
2.- Qu’est ce que la synthèse vocale?
http://www.technolangue.net/imprimer.php3?id_article=275

Rubrique: TIC
Auteur: PROMOTIC | gregorydomond@hotmail.com
Date: 21 Avril 2011
Liste complète des mémoires et travaux de recherche