– Soumaya Gharsallaoui a soutenu sa thèse de doctorat en génie électrique –
Le blogue d’information En Tête de l’Université du Québec à Trois-Rivières (UQTR) présente le résumé de thèse de doctorat en génie électrique de Mme Soumaya Gharsallaoui, intitulée «Détection et classification de traits paralinguistiques par des métriques rythmiques de la parole».
L’objectif des systèmes modernes de reconnaissance vocale est de modéliser les compétences cognitives de l’être humain et plus particulièrement les phénomènes paralinguistiques, afin de créer des interactions humain-système plus intuitives. Ainsi, dans les approches de recherche récentes, la paralinguistique est apparue comme la discipline qui peut appuyer la robustesse de l’interaction humain-système car elle s’intéresse à la façon dont l’être humain dit les mots plutôt qu’au contenu informationnel de ces derniers. C’est dans ce cadre que se situe cette thèse en visant le développement d’une méthode de détection et de classification automatique des traits paralinguistiques par des métriques adaptées extraites du signal de la parole.
La méthodologie proposée dans cette thèse pour la réalisation cette détection automatique des traits paralinguistiques est articulée autour de trois axes principaux. Le premier axe vise la détermination des paramètres acoustico-phonétiques pertinents qui possèdent la caractéristique de véhiculer l’information paralinguistique. C’est dans ce contexte qu’on a proposé une nouvelle approche combinant des paramètres auditifs et une métrique rythmique, tous extraits à partir du signal de parole. Le deuxième axe s’intéresse à l’évaluation des capacités de discrimination des paramètres acoustico-phonétiques et auditifs en les testant sur des corpus de développement. Des modèles analytiques ont été ainsi développés afin d’opérer la sélection optimale des paramètres les plus discriminants. Pour ce faire, des méthodes d’optimisation évolutionnaires telles que celles basées sur les algorithmes génétiques ou sur les essaims particulaires ont été mises à contribution. Enfin, le troisième axe vise à proposer les techniques les plus efficaces de reconnaissance de traits paralinguistiques qui sont dans notre cas les émotions et l’accent natif et non natif d’une langue. Le protocole expérimental suivi est basé sur les normes et les standards reconnus par la communauté scientifique du domaine.
Jury d’évaluation
Sid Ahmed Selouani, Ph. D., codirecteur de recherche
Professeur, Université de Moncton
Ismaïl Biskri, Ph. D., président du jury
Professeur, Université du Québec à Trois-Rivières
Habib Hamam, Ph. D., évaluateur externe
Professeur, Université de Moncton
Douglas O’Shaughnessy, Ph. D., évaluateur externe
Professeur, Université de Moncton
Adel Omar Dahmane, Ph. D., observateur
Professeur, Université du Québec à Trois-Rivières