Université du Québec à Trois-Rivières

Détection et classification de traits paralinguistiques par des métriques rythmiques de la parole

– Soumaya Gharsallaoui a soutenu sa thèse de doctorat en génie électrique –

Le blogue d’information En Tête de l’Université du Québec à Trois-Rivières (UQTR) présente le résumé de thèse de doctorat en génie électrique de Mme Soumaya Gharsallaoui, intitulée «Détection et classification de traits paralinguistiques par des métriques rythmiques de la parole».

160525_Sout.S_Gharsallaoui_seule

Soumaya Gharsallaoui, étudiante au doctorat en génie électrique. (Photo Annie Brien)

 

L’objectif des systèmes modernes de reconnaissance vocale est de modéliser les compétences cognitives de l’être humain et plus particulièrement les phénomènes paralinguistiques, afin de créer des interactions humain-système plus intuitives. Ainsi, dans les approches de recherche récentes, la paralinguistique est apparue comme la discipline qui peut appuyer la robustesse de l’interaction humain-système car elle s’intéresse à la façon dont l’être humain dit les mots plutôt qu’au contenu informationnel de ces derniers. C’est dans ce cadre que se situe cette thèse en visant le développement d’une méthode de détection et de classification automatique des traits paralinguistiques par des métriques adaptées extraites du signal de la parole.

La méthodologie proposée dans cette thèse pour la réalisation cette détection automatique des traits paralinguistiques est articulée autour de trois axes principaux. Le premier axe vise la détermination des paramètres acoustico-phonétiques pertinents qui  possèdent la caractéristique de véhiculer l’information paralinguistique. C’est dans ce contexte qu’on a proposé une nouvelle approche combinant des paramètres auditifs et une métrique rythmique, tous extraits à partir du signal de parole. Le deuxième axe s’intéresse à l’évaluation des capacités de discrimination des paramètres acoustico-phonétiques et auditifs en les testant sur des corpus de développement.  Des  modèles analytiques ont été ainsi développés afin d’opérer la sélection optimale des paramètres les plus discriminants. Pour ce faire, des méthodes d’optimisation évolutionnaires telles que celles basées sur les algorithmes génétiques ou sur les essaims particulaires ont été mises à contribution. Enfin, le troisième axe vise à proposer les techniques les plus efficaces de reconnaissance de traits paralinguistiques qui sont dans notre cas les émotions et l’accent natif et non natif d’une langue. Le protocole expérimental suivi est basé sur les normes et les standards reconnus par la communauté scientifique du domaine.

160525_Sout.S_Gharsallaoui

De gauche à droite: Douglas O’Shaughnessy, Ph. D. (INRS), Ismaïl Biskri, Ph. D. (UQTR), Soumaya Gharsallaoui, étudiante, Adel Omar Dahmane, Ph. D. (UQTR). En VIA, Sid Ahmed Selouani, Ph. D. (Université de Moncton) et Habib Hamam, Ph. D. (Université de Moncton). (Photo Annie Brien)

Jury d’évaluation

Sid Ahmed Selouani, Ph. D., codirecteur de recherche
Professeur, Université de Moncton

Ismaïl Biskri, Ph. D., président du jury
Professeur, Université du Québec à Trois-Rivières

Habib Hamam, Ph. D., évaluateur externe
Professeur, Université de Moncton

Douglas O’Shaughnessy, Ph. D., évaluateur externe
Professeur, Université de Moncton

Adel Omar Dahmane, Ph. D., observateur
Professeur, Université du Québec à Trois-Rivières