Mahindra Pratap Singh Dohare et Sanjaydeep Singh Lodhi
Résumé-Le Web est un immense espace d'information en lecture-écriture où de nombreux éléments tels que des documents, des images ou d'autres éléments multimédias peuvent être consultés. Dans ce contexte, plusieurs technologies de l'information ont été développées pour aider les utilisateurs à satisfaire leurs besoins de recherche sur le Web, et les plus utilisées sont les moteurs de recherche. Les moteurs de recherche permettent aux utilisateurs de trouver des ressources Web en formulant des requêtes (un ensemble de termes) et en examinant une liste de réponses. Le Web sémantique améliore l'infrastructure Web avec une sémantique formelle et des données interconnectées, permettant des systèmes de gestion des connaissances flexibles, réutilisables et ouverts. L'évolution vers des données ouvertes et interconnectées sur le Web et le Web sémantique se traduit par des systèmes plus ouverts. Contrairement aux applications traditionnelles basées sur des bases de données, les systèmes ouverts libèrent les données sur lesquelles ils opèrent : les sources sont décentralisées, les données peuvent être semi-structurées avec un vocabulaire arbitraire et les contributions peuvent être publiées n'importe où. Cette thèse propose des algorithmes et des composants qui simplifient et soutiennent la gestion des connaissances basée sur la technologie du Web sémantique. Nous abordons quatre domaines du développement d'applications Web sémantiques : l'accès programmatique : comment programmer par rapport au modèle flexible basé sur des graphes ; la navigation dans les données : comment naviguer dans des espaces d'informations arbitraires ; saisie de données : comment guider les utilisateurs à travers des recommandations collaboratives ; et découverte de données : comment localiser des sources de données pertinentes. Notre hypothèse est que les problèmes d'accès programmatique, de navigation dans les données, de saisie de données et de découverte de données peuvent être résolus, avec des résultats acceptables, par la seule introspection des données d'instance au moment de l'exécution, sans s'appuyer sur des structures de schéma fixes au moment de la conception. Dans ces quatre domaines, nous concevons des solutions indépendantes du domaine, qui s'appuient uniquement sur des données d'instance et s'adaptent dynamiquement aux données disponibles.