J. Ashok Kumar et PR Rao
Dans l'apprentissage supervisé, les classificateurs sont formés avec des données constituées d'étiquettes de classe pour résoudre des problèmes de classification du monde réel. Les arbres de décision, la forêt aléatoire, Bayes naïf, les réseaux bayésiens, la régression logistique du voisinage le plus proche, les réseaux neuronaux artificiels et les machines à vecteurs de support sont quelques-unes des techniques de classification les plus populaires parmi la classe des classificateurs populaires disponibles pour les chercheurs. Bien que chacune de ces techniques ait ses propres atouts pour traiter divers problèmes du monde réel, elles présentent également des problèmes inhérents. Aucune technique de classification ne peut être appliquée universellement à toutes les applications du monde réel. Dans le passé, plusieurs chercheurs ont essayé de comprendre le comportement de ces techniques en les appliquant à différents domaines de recherche. Dans le présent article, nous avons expérimenté des ensembles de données de formation et de test utilisés par certains des chercheurs pour mieux comprendre le comportement des classificateurs ci-dessus. L'étude révèle les insuffisances de certaines techniques et la supériorité des machines à vecteurs de support et de la régression logistique par rapport aux autres outils utilisés.