Dr V. Radha et G. Anuradha
À l'ère moderne de la communication, l'audio joue un rôle important dans la compréhension des médias numériques. En raison de l'essor des appareils de capture audio économiques, la quantité de données audio disponibles en ligne et hors ligne est énorme et les techniques permettant de classer et de récupérer automatiquement ces données audio sont un besoin immédiat. Un système automatique de classification et de récupération audio basé sur le contenu se compose de trois modules, à savoir l'extraction de caractéristiques, la classification et la récupération. Cet article présente une étude comparative de deux algorithmes qui effectuent ces trois étapes de différentes manières. Les performances des systèmes sélectionnés sont analysées en utilisant quatre caractéristiques différentes (acoustique, perceptuelle, coefficients cepstraux de fréquence mél (MFCC) et une combinaison de perceptuelle et de MFCC) et quatre classificateurs qui ont amélioré la machine à vecteurs de support (SVM) et le réseau neuronal centroïde (CNN) avec ses versions de base, SVM et CNN. Les résultats expérimentaux ont montré que l'algorithme SVM amélioré lors de l'utilisation du vecteur de caractéristiques combiné produisait une précision améliorée et un taux d'erreur réduit.