K. Vanith et R. Santhi
Dans cet article, nous décrivons une implémentation d'Apriori basé sur le hachage. Nous analysons, théoriquement et expérimentalement, la structure de données principale de notre solution. Cette structure de données est le facteur principal de l'efficacité de notre implémentation. Nous proposons un algorithme efficace basé sur le hachage pour la génération d'ensembles candidats. Explicitement, le nombre d'ensembles candidats à 2 éléments générés par l'algorithme proposé est, en ordre de grandeur, plus petit que celui des méthodes précédentes, résolvant ainsi le goulot d'étranglement des performances. Notre approche analyse la base de données une fois en utilisant une version améliorée de l'algorithme a priori. Notez que la génération d'ensembles candidats plus petits nous permet de réduire efficacement la taille de la base de données de transaction à un stade beaucoup plus précoce des itérations, réduisant ainsi considérablement le coût de calcul des itérations ultérieures.