Contient une présentation
Durée : 0h 32m 9s
Langue : Français (fr)
Production : Université Louis Pasteur, Strasbourg
Réalisation : Colloques et Conférences
description de la vidéo :
Le traitement automatique de la parole a pour but de doter une machine de capacité de
production (synthèse) et de compréhension (reconnaissance) de la parole. Des progrès
considérables ont été faits au cours des trente dernières années et des systèmes relevant des deux
catégories ci-dessus sont désormais d’usage quotidien.
Les processus de production et de perception de la parole sont assez bien connus et ont
donné lieu à l’élaboration de nombreux modèles théoriques que nos présenterons brièvement. Ces
modèles sont parfois une source d’inspiration pour les concepteurs de systèmes automatiques de
synthèse et de reconnaissance de la parole mais, le plus souvent, ils se révèlent inutilisables en
pratique. Nous illustrerons ce constat par des exemples réels et nous montrerons comment les
modèles théoriques ont été améliorés, parfois même complètement modifiés, pour permettre la
mise en oeuvre de systèmes réels.
Ainsi, en synthèse de la parole, les modèles initiaux du conduit vocal ont été remplacés
par des modèles de production fondés sur les formes d’onde. En reconnaissance de la parole, les
modèles les plus performants sont à base de modélisation stochastique markovienne impliquant
des hypothèses simplificatrices drastiques par rapport à la théorie.
Les recherches actuelles s’efforcent de concilier modèles théoriques et modèles
opérationnels de façon à améliorer ces derniers. Nous terminerons en montrant les travaux menés
en ce sens.
description de la session :
Modérateur : R. Dos Santos Ferreira, IUF, ULP