Sanjaydeep Singh Lodhi, Sandhya Rawat et Premnarayan Arya
L'exploration fréquente d'ensembles d'éléments, la tâche consistant à trouver des ensembles d'éléments qui apparaissent fréquemment ensemble dans un ensemble de données, est au cœur du domaine de l'exploration de données depuis seize ans. Au cours de cette période, la taille des ensembles de données a augmenté beaucoup plus rapidement que la capacité des algorithmes existants à gérer ces ensembles de données. Par conséquent, des améliorations sont nécessaires. Dans cette thèse, nous prenons l'algorithme classique pour le problème, A Priori, et l'améliorons de manière assez significative en introduisant ce que nous appelons un tri vertical. Nous utilisons ensuite le grand ensemble de données, les documents Web, pour comparer nos performances à plusieurs implémentations de pointe et démontrons non seulement une efficacité égale avec une utilisation de mémoire inférieure à tous les seuils de support, mais également la capacité d'exploiter des seuils de support encore inédits dans la littérature. Nous indiquons également comment nous pensons que ce travail peut être étendu pour obtenir des résultats encore plus impressionnants.