Kanhaiya Lal et NC Mahanti
Les algorithmes d'exploration de règles d'association se concentrent sur la découverte de règles valides en testant tous les éléments du domaine, plutôt que de tester certains éléments connus, ce qui rend le processus inefficace car il génère un très grand nombre de candidats. De plus, la plupart des algorithmes nécessitent plusieurs passages sur la base de données, ce qui entraîne un coût d'E/S très élevé. Comme la base de données réside sur le disque et ne peut pas être gérée entièrement dans la mémoire principale, plusieurs passages sur la base de données réduisent considérablement les performances de tout algorithme d'exploration de règles d'association connu. La solution proposée à ce problème est de séparer les sous-domaines disjoints, qui sont corrélés. Dans cet article, nous nous concentrons sur 1. La séparation des sous-domaines qui sont composés d'éléments corrélés dans le domaine. 2. Résumé de la base de données. Les éléments d'un grand domaine sont corrélés les uns aux autres en formant de petits sous-groupes, c'est-à-dire que le domaine est regroupé en petits groupes [3]. Cette propriété apparaît dans de nombreux cas réels, par exemple la bioinformatique, le commerce électronique, etc. [3]. L'élément d'un sous-groupe peut être traité pour la découverte de règles d'association car dans ce cas, la taille de l'ensemble candidat est comparable à la taille exponentielle des candidats d'Apriori sous forme pure. La plupart des algorithmes effectuent plusieurs passes sur l'ensemble de la base de données, ce qui entraîne une inefficacité et des frais généraux d'E/S élevés. L'algorithme proposé conserve une liste de transactions liées au composant en cours de traitement et, par conséquent, seules ces transactions sont traitées au lieu de l'ensemble de la base de données.