Les petites cases

Photos, livres, musiques, what else ?

N'en déplaise à certains. Le manque de courage et les problèmes de structuration de ma pensée ne sont pas les seuls responsables de la diminution drastique des publications de ce blog. J'ai aussi mis à profit ces derniers mois pour développer plusieurs prototypes visant à démontrer les possibilités offertes par les technologies du Web sémantique et les données mises à disposition selon les principes du Linked Data. Je vous avais déjà présenté « la boîte à souvenirs », Manue s'était chargée, comme il se doit, du « Linked Book Mashup », permettez-moi de vous dévoiler aujourd'hui « Linked My Music ».

Ce dernier prototype est né de l'envie de transformer en RDF les métadonnées ID3 embarquées dans mes fichiers MP3 et de les relier aux données du Linked Data. En m'appuyant sur les bibliothèques PHP GetID3 et EasyRDF et le formidable framework PHP de Benjamin Nowack, ARC, j'ai mis au point une application qui offre les fonctionnalités suivantes :

  • Récupération automatique d'un ensemble de ressources liées sur Dbpedia et BBC Music ;
  • Interfaces pour naviguer dans la collection de musique organisée par album et par artiste.

Finalement, l'ensemble des données est structuré sur le modèle suivant :

Modèle de données de Linked My Music

Sur le même modèle, le « Linked book Mashup » est, quant à lui, la concrétisation d'un Use case exposé par Manue dans sa présentation des enjeux du Linked Data dans les bibliothèques. J'ai donc cherché à rassembler le plus de données bibliographiques possibles ce qui forme le graphe suivant :

Modèle de données du Linked Book mashup

Développer en s'appuyant sur les technologies du Web sémantique et les données du Linked Data offre la possibilité de stocker et interroger des données avec des structures hétérogènes sans restriction a priori du modèle, de constituer rapidement une base de données brutes issues de multiples sources et de ré-exposer les données avec un sparql endpoint.

En revanche, même si je ne partage pas complètement l'avis de Nicolas sur l'utilisation des vocabulaires RDF dans le Linked data, force est de constater que les deux principaux fournisseurs que sont Freebase et Dbpedia utilisent des ontologies qui leur sont propres et qui ne sont pas alignées avec d'autres ontologies. De plus, alors que dans le cas des données musicales, les liens entre les différents ensembles de données sont effectués (le pivot que constitue Music Brainz et la forte implication d'Yves n'y sont certainement pas étrangers), le cas des données bibliographiques est beaucoup plus complexe voire balkanique, sans compter sur le manque d'expressivité des relations dans tous les cas.

Au final, à titre personnel, ces expériences sont très positives, car elles m'ont permis de confirmer les avantages du Linked Data présentées habituellement et de disposer d'exemples concrets pour appuyer mes propos (n'hésitez d'ailleurs pas à les réutiliser, ils sont là pour ça). Si elles se limitent à des types de données précis, ce n'est que par choix, les possibilités du Linked Data sont immenses : films, entreprises, données pour la biologie et la médecine, données bibliographiques de la recherche scientifique, événements historiques, données issues des différents réseaux sociaux... D'ailleurs, un petit sondage, quel mashup souhaiteriez-vous voir concrétiser avec les données du Linked Data ?

Structuration Sparql Wikipedia Geekeries Linked Data — 

Commentaires

Merci et bravo pour ce nouveau démonstrateur !

J'imagine pour ma part un outil permettant aux petits agriculteurs, maraîchers, de mieux gérer leurs parcelles agricoles en renseignant ce qu'ils cultivent à l'instant T, les rendements lors des récoltes etc. ce qui leur permettrait d'avoir un historique de ce qu'ils ont fait avec une gestion des stocks de semences. Ils pourraient aussi y mettre des infos géographiques, météorologiques et on pourrait même imaginer un réseau social autour de ça pour faciliter les échanges. Le tout au final pouvant être requêté ce qui devrait donner des résultats statistiques intéressants à grande échelle.

Pour qu'ils puissent préciser ce qu'ils cultivent, cela demande biensur d'avoir une liste la plus exhaustive et la plus structurée possible des espèces et variétés de plantes ; c'est là où il pourrait être intéressant de récupérer ces données à partir de dbpedia par exemple. Mais là aussi se pose la question des ontologies, après quelques recherche il semblerait qu'une ontologie agricole soit en cours de conception par la FAO. Mais aucune idée du temps qu'il faudra pour qu'elle soit réalisée.

Bravo pour vos deux «Mashups» (je n’avais pas regardé celui sur les livres avant aujourd’hui).

Quelques questions:
- Comment importez-vous les données sur les livres dans votre système? J’ai l’impression que vous n’utilisez pas de service de type http://www.anobii.com/.
- De même pour la musique connaissez-vous http://libre.fm ?
- Avez-vous l’intention de distribuer, sous une licence libre, le code source de ces deux mashups. ou bien des autres applications de votre «labs»?