Muthukumar. R C. Chandrasekar
L'indexation d'une base de données XML dans un entrepôt de données est un problème complexe. La principale raison d'être de l'indexation d'une base de données XML dans un entrepôt de données est due à l'environnement hétérogène et structurel des données XML qui peut rendre la construction de modèles de requête fastidieuse. Les techniques existantes se sont concentrées sur les méthodes de clustering basées sur l'intégration de l'entrepôt de données avec des données Web pour les techniques de traitement analytique en ligne (OLAP). Grâce au processus de clustering, la récupération rapide des informations est impossible car la technique de clustering est exactement utilisée pour le cadre de construction de modèles d'arbre. La plupart des stratégies d'indexation XML le divisent en plusieurs sous-requêtes, puis connectent leurs résultats pour présenter la réponse à la requête unique. Les opérations de jointure ont été déterminées comme le composant le plus chronophage du traitement des requêtes XML pour la récupération d'informations. Pour améliorer les critères de recherche dans la base de données XML présente dans l'entrepôt de données, dans cet article, un schéma d'indexation est utilisé qui sépare les données en fonction de l'objectif. Une technique d'indexation XSeq est présentée sur la base du cadre de modèle de structure arborescente. XSeq construit son cadre d'infrastructure d'indexation sur une base beaucoup plus simple et symbolise à la fois les données XML et les requêtes XML sous forme de séquences codées de formation. De plus, l'infrastructure XSeq réunit à la fois le contenu et la construction des documents XML, ce qui permet une présentation plus poussée que l'indexation du contenu et de la construction, ou leur indexation individuelle. Une amélioration fiable des performances est obtenue avec le système IRIS (Information Retrieval using Indexing Scheme) proposé dans la base de données XML vers l'entrepôt de données, par rapport à une technique SDC existante pour OLAP, en termes de longueur du chemin de recherche, de coût de recherche et de maintenance.