... est un personnage de la série "La belgariade" & "La malloré" de David & Leigh Eiddings. Mais je ne vais vous parler de ce bon vieux prince Kheldar.
En réalité, le Silk dont je veux vous parler (certes brièvement) est un framework sous licence Apache qui permet de lier des ressources de différents Endpoints. Cet outil est écrit en Scala (oh zut je vais devoir m'y mettre! =D) et semble relativement simple d'utilisation. (En tout cas pour la version "Simple Machine", il existe également une version "MapReduce" et une version "Server").
Le principe est le suivant.
A l'aide d'un fichier XML (le Silk LSL pour Silk Link Specification Language), on définit deux EndPoints comme DataSource. Nous définissons ensuite le type de ressource à comparer dans ces EndPoints avec des méthodes d'évaluation. (Calcul de similarité, définition des seuils d'acceptation...) On lance Silk et HOP!
nous obtenons un fichier RDF qui relie les ressources jugées identiques par un type de relation définie dans le fichier Silk LSL (owl:sameAs par exemple).
Depuis la version 2.4.2, il est possible d'intégrer directement ces liens dans un triplestore à l'aide de requêtes SPARQL Update.
Cet outil est à évaluer plus en détail mais le principe me plaît bien...
Je posterai un prochain article sur le sujet avec des exemples.