Adrien Basse
Résumé de nos travaux
De nombreuses applications web sémantique s’intéressent à la problématique d’intégration de données issues de sources RDF distribuées. Pour l’exécution de requêtes distribuées, par exemple, plusieurs solutions sont ainsi proposées comme SPARQL 1.1 Federation qui définit un ensemble d’extensions au langage de requête SPARQL. Si ces extensions permettent de déléguer une partie de requête à un ensemble de services un problème majeur subsiste encore pour déterminer automatiquement en amont les services disposant de réponses pour une requête donnée. La résolution de ce problème est particulièrement cruciale dans un contexte comme le Linking Open Data où de nombreuses sources RDF hétérogènes sont publiées. Pour pouvoir envoyer une requête uniquement aux sources de données concernées, une description complète et compacte de chaque source est nécessaire. Pour connaitre le contenu d’une source RDF nous pouvons nous baser sur les motifs de graphes qui la composent.
Dans cette thèse nous nous intéressons à l’extraction de ces motifs de graphes. Nous proposons pour cela une extension du codage DFS (Depth-First Search) de [1] aux motifs de graphes RDF qui sont orientés et étiquetés et une opération de jointure entre codes DFS pour construire itérativement les différents niveaux d'une structure d'index de sources de données RDF. La structure d'index ainsi générée est constituée d'une hiérarchie de graphes RDF et permet d'identifier les types de données contenus dans la source indexée.
Références
Service gratuit simple et accessible à tous
Créer un site Internet gratuitement