Les petites cases

Stocker les triples

Commentaires

IMHO il manque un triple-store léger et facile à mettre en place. J'ai n'ai fais que survoler les différentes solutions listées sur ESW mais j'ai l'impression que l'on tombe à chaque fois sur un truc "bloated", complètement inutile/inutilisable dans le cadre de petites applications.
Tu es un peu dur, je te conseille de jeter un coup d'oeil à ARC ou RAP qui répondront à mon avis à tes attentes.
Yep, pour confirmer ce que dit got, un entrepôt s'installe avec RAP en une dizaines de lignes de PHP. Sinon, une lib python comme librdf propose aussi un petit moteur de stockage sur disque. Mais je pense qu'une chose importante à prendre en compte, outre les performances brutes en terme de requête, est la capacité d'inférence de ces différents entrepôts, qui est assez variables selon les approches (de rien (Boca) à la gestion de certaines propriétés OWL (Allegro) en passant par la gestion des sous-classes / sous-propriétés (3store) ). Parce que stocker du RDF "brut", c'est bien, mais avec un système capable de prendre en compte les spécificités des ontologies utilisées pour décrire ces triplets, c'est encore mieux :)
En fait les équipes qui développent des triple-stores utilisent en général le benchmark LUBM qui teste à la fois des vitesses de chargement, de requête, et leur exactitude en terme d'inférence. Dans la liste des repositories basé sur RDBMS, j'ajouterai Minerva ( http://www.springerlink.com/content/k8tnmw751g375544/ )/ SOR développé par une équipe d'IBM qui est aussi très prometteur...
@JSB : Merci pour l'indication, j'avais loupé cette référence essentielle. Concernant SOR, si vous avez plus d'informations, je suis preneur, je n'ai rien trouvé de bien probant pour le moment, sinon j'attendrais qu'IBM nous en dise plus ;-)
L'ancienne version (qui date un peu) est dispo sur alphawork : http://www.alphaworks.ibm.com/tech/semanticstk Sinon j'avais testé la dernière version sur plus de 100 millions de triple dans une utilisation assez industrielle et c'était très prometteur. Une (très) petite description sur http://www.vldb.org/conf/2007/papers/demo/p1402-lu.pdf
@JSB : Merci pour ces renseignements, n'hésite pas si tu as des nouvelles, je suis intéressé.
nous avons décris RFD dans un annuaire LDAP et nous l'avons chargé avec toute la nomenclature d'un Conseil Général. Une application JAVA reposant sur JNDI permet de la maintenir et de l'interroger. Les performances sont excellentes. Un web-services permet aux applications d'utiliser ce référentiel. Un annuaire LDAP/X.500 de type hiéarchique peut être une solution.
Bonjour, Je suis très intéressé par ce que je lis depuis quelques temps, ici ou ailleurs, sur le web sémantique. Je cherche à créer une activité professionnelle prenant la forme d'un site internet, et dans laquelle l'indexation d'images a une grande importance (en vue de permettre aux internautes de trouver celles qui leur conviennent aussi facilement que possible). Aussi, quitte à devoir passer beaucoup de temps a indexer les images (dans une base de données et non pas au sein des images elles-mêmes, je le précise), je me suis dit qu'il fallait pouvoir en tirer le maximum. Et de ce point de vue, la découverte de RDF m'a ouvert pas mal de possibilités, a fortiori lorsqu'il est structuré via une ontologie OWL en vue de permettre des inférences via SPARQL. La lecture de votre billet et de ses commentaires me conforte dans l'idée que tout cela manque encore un peu de maturité - y compris, et peut-être d'abord, ma propre compréhension des techniques sous-jaçentes et de tout ce qu'elles impliquent. Je ne suis donc pas loin de conclure que la création d'un SGBD en PHP/MySQL (ce sera au moyen du CMS Drupal 6) fera l'affaire dans un premier temps. Toutefois, j'aimerais recueillir svp vos conseils concernant la structuration d'un tel SGBD, en vue d'utiliser aussi pleinement que possible les ressources du web sémantiques un peu plus tard. Puis-je dores et déjà structurer ma BD de telle sorte qu'elle soit "owl/rdf compatible" puis, ultérieurement, pleinement interrogeable via sparql ?

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
7 + 1 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.