Si vous vous intéressez au monde de la sémantique, vous connaissez surement Wordnet.
Pour ceux qui n'en ont jamais entendu parler, Wordnet est une base de données lexicale développée par un labo de l'université de Princeton (licence libre).
"Mais c'est quoi ?!" me demanderez vous !
Une base de données lexicale contient des mots ainsi que leurs types (ex : "pomme" est un nom, "manger" est un verbe...). Il y a également des références entre ces mots afin de nous permettre de trouver des synonymes, des hypernimes (des concepts plus généraux)...
Et bien j'ai découvert qu'il héxite une version de Wordnet au format RDF/OWL ici!
Il ne s'agit pas de la dernière version (à savoir la 3.1) mais de la version 2. Je trouve que l'interrogation en Sparql pour ce type de données et tout à fait pertinent, ne serait-ce que pour les possibilités d'inférence proposées par certain outil.
Pour ceux que le RDF/OWL & Sparql rebute, il y a aussi une version SQL ici.
Wordnet ne traite que les mots de la langue anglaise, aussi pour ceux qui souhaitent jouer avec une base lexicale française se basant sur Wordnet, vous pouvez regarder du côté de WOLF. (également libre)
Enfin, il y a EuroWordnet qui traite différentes langues, dont le français, l'italien, l'allemand. Seulement, la licence n'est pas une licence libre.
Aucun commentaire:
Enregistrer un commentaire