Pujari Pushpalata
Cet article décrit l'analyse des performances de différents classificateurs d'exploration de données avant et après la sélection des caractéristiques sur un ensemble de données binomiales. Trois classificateurs d'exploration de données, les classificateurs de régression logistique, SVM et de réseau neuronal, sont considérés dans cet article pour la classification. L'ensemble de données Congressional Voting Records est un ensemble de données binomiales étudié dans cette étude et est tiré du référentiel d'apprentissage automatique de l'UCI. Les performances de classification de tous les classificateurs sont présentées à l'aide de mesures de performance statistiques telles que la précision, la spécificité et la sensibilité. Le graphique de gain et le graphique ROC (Receiver Operating Characteristics) sont également utilisés pour mesurer les performances des classificateurs. Une étude comparative est menée parmi les classificateurs d'exploration de données. Les résultats expérimentaux ont montré que sans sélection de caractéristiques, les classificateurs de régression logistique et SVM offrent une précision de 100 % et le réseau neuronal offre une précision de 98,13 % sur l'ensemble de données de test. Avec la sélection de caractéristiques, le classificateur SVM offre une précision de 100 %. Les performances du classificateur SVM s'avèrent être les meilleures parmi tous les classificateurs avec un nombre réduit de fonctionnalités.