M. Pritaj Yadav et Mme Alka Gulati
L'informatique en nuage est une pratique émergente qui offre une infrastructure et une flexibilité financière nettement supérieures aux modèles informatiques traditionnels. Lorsque l'on envisage des offres d'infrastructure en nuage, la sécurité est une préoccupation courante. Les grandes entreprises peuvent avoir mis en œuvre des approches de sécurité très solides qui peuvent ou non être égalées par les fournisseurs de cloud, mais ne partez pas du principe que la sécurité est un problème. Recherchez le type de fonctionnalité de sécurité que vous rechercheriez dans une solution interne. Un document peut être mis en miroir pour éviter les retards ou pour offrir une tolérance aux pannes. Les algorithmes de détection des documents répliqués sont essentiels dans les applications où les données sont obtenues à partir de sources multiples. La suppression des documents répliqués est nécessaire, non seulement pour réduire le temps d'exécution, mais également pour améliorer la précision de la recherche. Aujourd'hui, les robots des moteurs de recherche récupèrent des milliards d'URL uniques, dont des centaines de millions sont des répliques d'une certaine forme. Ainsi, dans cet article, nous proposons d'identifier rapidement la détection des réplications pour accélérer l'indexation et la recherche. En présentant efficacement uniquement les documents uniques, la satisfaction des utilisateurs est susceptible d'augmenter.