Nikhil D. Karande, Rohit V. Kumbhar, Abhijeet L. Jadhav, Sharad G. Bhosale, Swapnil S. Patil
La parole véhicule plusieurs niveaux d'information. Au premier niveau, la parole transmet les mots ou le message prononcés, mais au deuxième niveau, elle révèle également des informations sur le locuteur. Dans cet article, nous présentons un aperçu de nos efforts de recherche dans le domaine de la reconnaissance automatique du locuteur. Nous basons notre approche sur une technique de modélisation statistique du locuteur qui représente les sons caractéristiques sous-jacents de la voix d'une personne. À l'aide de ces modèles, nous construisons des systèmes de reconnaissance du locuteur peu coûteux en termes de calcul et capables de reconnaître un locuteur indépendamment de ce qui est dit. Les performances des systèmes sont évaluées pour une large gamme de qualités de parole, de la parole claire à la parole téléphonique, en utilisant plusieurs corpus de parole standard.