Vidushi Singhal et Sachin Sharma
Internet est utilisé activement pour l'échange d'informations. Le fonctionnement du WWW commence par la saisie d'une URL dans la barre d'adresse ou par un clic sur un lien. Il nous conduit à un endroit donné. Les données sont stockées dans les serveurs Web qui servent d'épine dorsale du World Wide Web. Les gens téléchargent les pages Web et mettent à jour les nouvelles pages Web très fréquemment. Le contenu de la page Web change fréquemment. Un robot d'exploration ajoute de manière récursive de nouvelles URL au référentiel de base de données d'un moteur de recherche. Il se peut qu'après avoir téléchargé une page Web particulière, la copie locale de la page résidant dans le référentiel Web des pages Web devienne obsolète par rapport à la copie présentée sur le Web. Les utilisateurs ne s'intéressent souvent pas seulement au contenu actuel de la page Web, mais également aux changements qui y sont apportés. Il devient donc nécessaire de développer un système efficace qui pourrait détecter ces changements efficacement et dans un temps de navigation minimum. Il faut donc prévoir une mise à jour de la base de données à intervalles réguliers. Une fois que nous décidons de mettre à jour une page, il faut s'assurer que des ressources minimales sont utilisées. Divers outils et services sont également disponibles qui peuvent être utilisés pour détecter ces changements. Dans cet article, en tirant parti des travaux antérieurs, une nouvelle approche est discutée pour dériver certains paramètres, qui peuvent aider à déduire le fait que les données ont changé ou non.