Adrien Basse

Accueil
Résume
Publication

Résumé de nos travaux

De nombreuses applications web sémantique s’intéressent à la problématique d’intégration de données issues de sources RDF distribuées. Pour l’exécution de requêtes distribuées, par exemple, plusieurs solutions sont ainsi proposées comme SPARQL 1.1 Federation qui définit un ensemble d’extensions au langage de requête SPARQL. Si ces extensions permettent de déléguer une partie de requête à un ensemble de services un problème majeur subsiste encore pour déterminer automatiquement en amont les services disposant de réponses pour une requête donnée. La résolution de ce problème est particulièrement cruciale dans un contexte comme le Linking Open Data où de nombreuses sources RDF hétérogènes sont publiées. Pour pouvoir envoyer une requête uniquement aux sources de données concernées, une description complète et compacte de chaque source est nécessaire. Pour connaitre le contenu d’une source RDF nous pouvons nous baser sur les motifs de graphes qui la composent.
Dans cette thèse nous nous intéressons à l’extraction de ces motifs de graphes. Nous proposons pour cela une extension du codage DFS (Depth-First Search) de [1] aux motifs de graphes RDF qui sont orientés et étiquetés  et une opération de jointure entre codes DFS pour construire itérativement les différents niveaux d'une structure d'index de sources de données RDF. La structure d'index ainsi générée est constituée d'une hiérarchie de graphes RDF et permet d'identifier les types de données contenus dans la source indexée.


Références

  1. Yan, X et J. Han (2002). gspan: Graph-based substructure pattern mining. In ICDM’02, Maebashi, Japan, pp. 721-724.

Service gratuit simple et accessible à tous

Créer un site Internet gratuitement
Créer un site avec
SiteW
Site créé avec l'outil https://www.sitew.com/ | Créer un blog pro