Les petites cases

Outils

RDFaiser votre blog, 1ère partie : la théorie

HTML, de même que XHTML, permet de structurer une page Web selon les principes d'un langage à balises. Les différentes balises indiquent de manière hiérarchique le rôle joué par chaque portion d'information dans le contexte de la page Web.

Ainsi, la structure d'un document HTML, comme tout document XML, ne décrit pas le contenu/le message de la page Web, mais reflète la structure de la page Web en elle-même. C'est pourquoi il me semble erroné de parler de « sémantisation », lorsqu'on encode en HTML ou, plus généralement, en XML.

Par exemple, soient les deux portions de code HTML suivants :

<div class="contenu">
       <p class="normal">
                Le <a href="http://barcamp.org/SemanticCampParis">SemanticWeb camp</a> se déroule à Paris
                le samedi 16 février 2008 à partir de 9h30.
        </p>
</div>

<div class="description">
         <ul>
                <li>
                        Le <strong>SemanticWeb camp</strong> se déroule à Paris
                        le <em>samedi 16 février 2008 à partir de 9h30</em>.
                </li>
         </ul>
</div>

Ces deux bouts de code HTML ne sont pas identiques du point de vue de la structure, pourtant, du point de vue du contenu, ils délivrent la même information, le même message. Si certains pourraient y voir une limitation de XML, il n'en est rien. Ce n'est tout simplement pas son rôle.


Lire la suite...

Structuration Moteur de recherche RDFa XHTML Geekeries —  2 commentaires

Google se met à FOAF

Alors que j'expliquais dans mon précédent billet en quoi FOAF constituait une réponse aux problèmes de contrôle des données personnelles et d'interopérabilité entre les services de réseaux sociaux, Google semble me donner raison avec la sortie d'une nouvelle API : Social graph API. Si Google a longtemps traîné des pieds avant de s'intéresser aux technologies du Web sémantique, nous étions beaucoup à penser qu'il ne leur faudrait pas énormément de temps le jour où il voudrait s'y mettre. Il semble que ce jour soit arrivé.

Qu'en est-il exactement ?

Pour faire simple, Social Graph API permet d'effectuer des requêtes sur les données indexées par Google et encodées avec FOAF, XFN (pour faire vite, l'équivalent de FOAF avec les microformats) et les profils publics de certains services comme MySpace. Grâce à cette API, vous pouvez, par exemple, retrouver les différentes personnes qui sont liées à vous par l'intermédiaire d'un FOAF ou d'un XFN, concaténer en un point unique les informations éparpillées entre vos différentes pages de profils des services auxquels vous êtes abonnés (cf. l'exemple de Plaxo Pulse)...

Lire la suite...

Web sémantique Causeries Indexation Moteur de recherche —  9 commentaires

FOAF : le réseau social garanti sans pub !

Vous en avez marre des pubs intempestives de Facebook, vous n'arrivez plus à gérer à la fois vos profils sur Linked in et Viadeo, vous vous dites que Google a suffisamment d'informations sur vous pour ouvrir un compte sur Orkut et vous voulez garder l'entière maîtrise des informations en ligne vous concernant, car vous êtes néanmoins convaincu qu'une présence en ligne est essentielle. Alors, n'attendez plus, créez votre fichier FOAF, mettez le en ligne et participez à la construction du graphe global géant. Cerise sur le gâteau, vous disposerez avec SPARQL d'une API standard réellement ouverte pour accéder aux données, contrairement à d'autres...

Vous allez me dire que je vous ai déjà fait le coup, il y a deux ans et que FOAF n'a pas constitué la première brique annoncée du Web sémantique. Alors, qu'est-ce-qui a changé pour justifier un regain d'intérêt pour FOAF ?

Premièrement, les technologies, nous disposons de nombreuses implémentations qui commencent à devenir matures de RDF et de SPARQL dans différents langages : PHP, Java et autres... et des frameworks pour construire simplement des triples store RDF sont disponibles.

Deuxièmement, les données disponibles en RDF, cette année a été très riche dans la mise à disposition de données en RDF : geonames, Dbpedia, revyu... L'initiative « Linked data » a permis d'accélérer le mouvement pour la création du Web sémantique ou, plutôt, du Web of data et l'appropriation des technologies sous-jancentes.

Troisièmement, la montée en puissance des réseaux sociaux est indéniablement le principal argument qui plaide en faveur de FOAF. Les usages sont peu à peu apparus, mais aussi les limites. Les utilisateurs prennent peu à peu conscience des dangers que représentent la mise à disposition de leurs données personnelles dans des services centralisés dont le modèle économique repose presque exclusivement sur la publicité.

Lire la suite...

Web sémantique Blog Geekeries —  21 commentaires

Naviguer et rechercher dans le Web of data

Preuve supplémentaire de la maturité du Web of data, nous disposons, à l'instar de son grand frère le Web, de navigateurs et de moteurs de recherche spécialisés ne requérant aucune compétence particulière.

Petite revue de détail, en commençant par les navigateurs.

  • A tout seigneur, tout honneur, le premier d'entre eux mis au point par Tim Berners-Lee et son équipe : Tabulator développé en Javascript (Attention, ne fonctionne qu'avec Firefox). Outre la possibilité de naviguer dans des sources en RDF, il offre un moteur SPARQL, la possibilité d'afficher les données géographiques sur une carte, les événements sur un agenda ou une frise chronologique. C'est certainement le plus complet, mais aussi le plus geeky.
  • Dans le même ordre d'idée et proposant des fonctionnalités à peu près équivalentes, OpenLink RDF browser, qui sert de démonstration au produit Virtuoso server qui intègre, entre autres, un RDF store et sparql end point, de l'éditeur Open link software.
  • Plus simple et plus accessible, Disco hyperdata Browser mis au point par l'équipe de Dbpedia (ces types ne s'arrêtent jamais). L'interface est, disons, épurée, mais efficace. Fonctionnalité intéressante, il intègre un cache qui permet de disposer de tous les triples consultés récemment par les utilisateurs pour naviguer dans les sources RDF.
  • Pour finir, celui qui me semble le plus prometteur : Zitgist browser mis au point par Frederik Giasson. Aussi simple que Disco, mais avec une interface très agréable.

Lire la suite...

RDF Sparql Causeries Moteur de recherche Navigateur Linked Data —  3 commentaires

De la polysémie de "catégorisation" en recherche d'informations

A l'occasion de la lecture de l'article d'Olivier Ertzcheid, Gabriel Gallezot et Eric Boutin sur les perspectives documentaires sur les moteurs de recherche, je suis tombé sur le mot « catégorisation », j'imagine, pour définir la fonctionnalités des « termes associés » d'Exalead. Il s'avère que ce terme est une source d'ambiguïté permanente dans le domaine de la recherche d'informations, faisant référence à plusieurs fonctionnalités et plusieurs technologies différentes. Je vous propose de faire le point afin d'y voir plus clair.

Lire la suite...

Management de l'information Causeries Moteur de recherche —  1 commentaire

Le Web sémantique rencontre....

Preuve de la maturité des technologies et des standards du Web sémantique, les chercheurs et promoteurs du domaine vont à la rencontre d'autres communautés pour leur proposer de nouvelles applications, des idées, des tutoriaux, leurs expertises... Bref, des rencontres se produisent qui amènent des projets qui montrent chaque jour un peu plus la pertinence du modèle. Voici une petite sélection repérée ces derniers jours.

Lire la suite...

Management de l'information RDF Web sémantique Sparql Causeries Folksonomie Moteur de recherche OWL RDFa —  2 commentaires

La pelote de retour de vacances

Il aura fallu que je sois bloqué chez moi pour finir de vider mon agrégateur de tout ce qui s'était accumulé avant et pendant les vacances. Et, pour finir définitivement cette opération qui m'aura pris pas mal de temps, voici quelques ressources qui ont plus particulièrement retenu mon attention.

Du côté du Web sémantique, les deux sujets à la une restent "linked data" et RDF/A.

Lire la suite...

Moteur de recherche RDFa Web services Geekeries Linked Data — 

Le code de la knowledge box

Plusieurs d'entre vous m'ont demandé le code de la knowledge box. C'est avec plaisir que je vous en fais part, mais autant vous prévenir tout de suite je suis un très mauvais codeur quand il s'agit d'utiliser un langage de programmation. Merci d'avance pour votre indulgence à ce niveau ;-).

Six parties composent la knowledge box :

Lire la suite...

RDF Sparql Outils OWL RDFa Geekeries — 

Quelles sont les éléments d'une architecture documentaire ?

Dans une organisation, on crée et on échange de l'information. Mais on n'y accède pas de manière uniforme : selon les personnes qui veulent y accéder ou utiliser ces informations, selon leurs différentes fonctions dans l'organisation, ils auront besoin d'y accéder de manière différente, pour des besoins différents. Toutefois, l'information, elle, reste toujours la même : c'est sa présentation et son usage qui change, ce sont les différents services que l'on construit au-dessus de cette information qui doivent changer suivant les besoins.

Lire la suite...

Management de l'information RDF XML Système d'information Causeries Moteur de recherche Web services —  2 commentaires

Et si on prenait le problème en amont ?

La logique applicative répond à un besoin par la fourniture d'une solution intégrée dans laquelle ce sont des tâches qui sont mises en avant. L'intérêt se porte sur la solution technique et, non sur l'information qui est produite. Le système d'information est alors composé d'une multitude de logiciels incapables d'échanger l'information a priori. Deux solutions verrues ont été trouvés pour résoudre ce problème. Du côté des applications, le concept d'EAI (Enterprise application integration) fournit une architecture intermédiaire, le middleware ou intergiciel, permettant l'échange direct entre les applications. Du côté de l'information, les moteurs de recherche avec une multitude de connecteurs vont indexer l'ensemble des données pour y permettre un accès fédéré et des outils de text-mining vont potentiellement et miraculeusement structurer ce magma informe. Dans une certaine mesure, ces solutions fonctionnent, mais à quel prix vu l'investissement fourni. Croyez-moi, les gagnants dans l'histoire, ce ne sont pas les utilisateurs, d'autant plus que ces solutions ne sont pas entièrement satisfaisantes à long terme.

Lire la suite...

Management de l'information Système d'information Causeries —