Manzoor Ahmad Chachoo Dr SMK Quadri
Le système de dialogue parlé a un paramètre incertain pendant la reconnaissance vocale qui contrôle ses performances qui varient pour les différents utilisateurs ainsi que pour le même utilisateur lors de répétitions multiples du même dialogue. Cet article explique comment les erreurs de reconnaissance dans les énoncés des utilisateurs peuvent être traitées en utilisant des techniques d'apprentissage semi-supervisé sur le modèle d'état vectoriel caché (HVS). Le modèle HVS est une extension du modèle de base de Markov dans lequel le contexte est codé dans chaque état sous forme de vecteur. Les transitions d'état dans le HVS sont prises en compte dans une opération de décalage de pile similaire à l'automate à impulsion. Le modèle HVS étant un modèle statistique, il nécessite beaucoup de données d'apprentissage étiquetées, ce qui est pratiquement difficile. Dans cet article, nous présentons comment les approches d'apprentissage semi-supervisé de classification et de maximisation des attentes peuvent être formées sur des corpus étiquetés et non étiquetés pour gérer l'incertitude de l'utilisateur ainsi que les erreurs de reconnaissance par le système de reconnaissance vocale. Les résultats expérimentaux montrent que le cadre proposé utilisant le modèle HVS peut améliorer les performances de la gestion du dialogue du système de dialogue parlé par rapport au modèle de base.