Les petites cases

Quel événement !? Ou comment contextualiser le triplet

Commentaires

Très intéressant! Il est vrai que le modèle basé sur les événements est plus séduisant que la création de propriétés ad-hoc à la chaine. Même si il me semble que DBPedia a opté pour cette solution pour des raisons d'automatisme. Chaque entrée d'une InfoBox peut facilement être convertie en propriété+valeur (chaine) sans nécessiter d'information additionelle pour détecter la nature de la propriété.

Juste une remarque concernant le CONSTRUCT. La construction des URI avec "iri (bif:concat ("http://example.org/",str(?king),"/naissance"))" donne lieu à des URI du genre "<http://example.org/http://dbpedia.org/resource/Louis_XVI_of_France/naissance>". Alors que "iri (bif:concat ("http://example.org/",str(?label),"/naissance"))" permet de ne retenir que le nom :-)

Merci, Christophe.

"Même si il me semble que DBPedia a opté pour cette solution pour des raisons d'automatisme." Clairement, la maintenance du mapping et des algorithmes de conversion sont largement simplifiés en restant le plus proche possible de la structure des infobox, sans compter la génération des URIs qui serait un véritable casse-tête.

Concernant l'URI, c'est de la paresse, comme tu as pu le constater, cela a été corrigé dans les exemples finaux (à la main, je dois l'avouer). Ta proposition est séduisante, mais elle ne me satisfait pas complètement à cause des espaces blancs qui sont une horreur une fois encodé dans une URI, la meilleure solution est de placer une regexp ce qui, je suis sûr, doit être possible. En revanche, ta remarque m'amène une question, peut-on avoir une URI du type http://exemple.org/http://example2.org, je vais vérifier cela.

Intéressante solution, mais qui ne lève pas ma réticence face à RDF, dont l'ontologie "réaliste" implicite, fondée sur une construction de triplets indépendants (et une acception de "prédicat" trop sommaire, à mon avis) me semble passer à côté des résultats d'années de recherche en logique, linguistique et épistémologie. Mais sans doute suis-je influencé par la relecture attentive que je viens de faire du livre de Pierre Jacob, L'intentionnalité: problèmes de philosophie de l'esprit, Odile Jacob, 2004, 978-2738115409.

La description d'un événement "ponctuel" à partir de time:DateTimeDescription risque de poser vite un problème de référence "universelle", en particulier pour l'accès à des entités couramment désignées sous la forme de descriptions définies, comme l'Académie française, la famille Hugo (souvenirs de problèmes d'indexation pour l'édition de la correspondance Hugo…).

Sans doute des solutions à chercher du côté des logiques floues — au prix de l'indépendance des triplets ?

Je suis bien incapable de te répondre sur l'aspect théorique, pour tout t'avouer, cela ne m'intéresse pas, à titre personnel, de pousser la réflexion dans cette perspective (même si ma curiosité ne demande qu'à être assouvi) et je laisse cela aux chercheurs (Fabien, Alexandre M., Christophe et les autres, je serai ravi d'avoir votre contribution sur cette question). Néanmoins, ton commentaire appelle plusieurs réflexions de ma part.

Le but des technologies du Web sémantique ne me semble pas à proprement parler de capturer la réalité ou de modéliser la connaissance du monde, mais de proposer un ensemble d'outils, de méthodes, de formalismes pour permettre l'échange entre les machines dans un espace en réseau (le Web) de données structurées.

Cet objectif passe par l'utilisation de résultats des recherches provenant effectivement aussi bien de la linguistique, de la logique de description (d'où le mot sémantique...), de la théorie des graphes que des bases de données.

Mais, avant tout, cela passe par une exigence de standardisation et c'est cela qui m'intéresse beaucoup plus car la standardisation permet l'émergence d'un écosystème d'outils et d'implémentations qui est censé faciliter (ou fluidifier) le déploiement d'un technologie. Surtout, une standardisation, à la différence de la recherche, est le fruit d'un compromis entre la recherche (et compromis entre les différents domaines : logiciens contre théoriciens des graphes par exemple...), justement, mais aussi les contingences de production, de développement et d'implémentation et les impératifs économiques et financiers (même si les technos du Web sémantique n'ont pas été concernés vraiment par ces aspects jusqu'à maintenant, ça commence à arriver).

De ce point de vue, deux remarques encore : tout d'abord, la standardisation vécue par certains comme un poids est, au contraire, une chance car elle peut faire gagner beaucoup de temps en évitant d'avoir à inventer son propre système et les limites inhérentes au compromis ne sont souvent que des prétextes, d'autre part, tu cites les recherches effectuées en logique, linguistique et épistémologie, mais je te renvoie la question, ces recherches ont-elles débouchées sur des technologies fiables, matures, répondant à la charge et aux exigences de plus en plus importantes de nos clients ? Je suis preneur dans ce cas, car, quand je vois les modèles sous-jacents aux bases dites NoSQL (du clé-valeur dans 80% des cas) qui font tant parler en ce moment et qui sont au cœur des grosses machineries comme Facebook, Twitter et autres, je m'interroge si ce n'est plus. Quant à l'analyse linguistique, la montée en puissance des méthodes probabilistes dénote d'un certain échec des grammaires formelles complexes, non ?

Un autre point est fondamental : c'est la courbe d'apprentissage pour l'appropriation d'une technologie par l'industrie (pour faire simple et pour faire large). Il ne faut pas oublier une chose : si HTML a fonctionné, c'est de par sa simplicité, mais HTML est une horreur en termes de structuration de l'information et a fait s'étrangler tous les spécialistes de SGML à l'époque. D'ailleurs, lorsqu'il s'est agi d'améliorer ces aspects avec la belle cathédrale XHTML 2 (et Xforms et les autres), il y a eu une véritable levée de boucliers des développeurs de navigateurs au prétexte que cela allait troubler les utilisateurs, que c'était trop compliqué à implémenter, que cela ferait tomber les perfs..., au point que le W3C a fait machine arrière et qu'on se retrouve dans HTML 5 avec des aberrations datant des débuts de HTML. De là à dire que simplicité et implémentation industrielle (cf. ma remarque ci-dessus sur NoSQL) demande parfois des compromis en termes d'état de l'art, il n'y a qu'un pas que je franchis allègrement. De plus, quand je vois la courbe d'apprentissage demandée pour prendre en main les technologies du Web sémantique, bien supérieur à celle de HTML, CSS voire XML et XSL, je m'inquiète du bagage conceptuel nécessaire à la compréhension des problématiques que tu exposes (et j'en suis le premier exemple :-) ).

Sur la problématique de la "référence universelle", je t'invite à regarder en détail l'ontologie 'Time Ontology" très complète, utilisée par la plupart des ontologies d'événements, qui dépasse très largement la description de time:DateTimeDescription et qui devrait répondre à un certain nombre de tes interrogations. J'en fais une utilisation dans mes exemples qui ne lui rend pas hommage.

Désolé, j'ai été un peu long comme d'habitude, mais cela me paraît important de ne jamais perdre de vue que ces technologies sont prévues pour être déployées sur des échelles très importantes (pour lesquelles, au passage, les technos ne sont pas forcément matures...) et que le souci de standardisation me semble un argument à ne jamais négliger.

Tout à fait d'accord sur l'importance des standards, et le rappel des objectifs (et problèmes) concrets des technologies du web "sémantique". Je suis moi aussi, par ailleurs, persuadé que la théorie des graphes et les approches statistiques fournissent un cadre plus opérationnel pour avancer dans ce domaine : les résultats en traitement automatique du langage sont bien là pour le prouver.

Cela dit, je pense que la recherche en logique et en linguistique a fourni des explications concrètes, des résultats proprement scientifiques, qui expliquent les échecs ou résultats décevants d'un certain nombre de modèles, "logicistes", ou déterministes, par exemple.
(L'histoire de la philosophie fournit quelques exemples de résultats bien analysés, de pistes qu'il n'y a plus lieu de suivre, de la characteristica universalis de Leibnitz, à Frege et Russell.)

Dans le cadre des technologies en question, il est crucial d'avoir des outils pour évaluer la pertinence et l'efficacité des standards en cours de développement ou d'adoption. Les constats de l'épistémologie sur les difficultés, les limites et les avantages des langages formels, de leurs relations avec le langage et le symbolique en général devraient permettre au moins de prédire les limites d'application de standards comme RDF, ou d'encourager l'émergence de modèles plus complexes (fonctions multivaluées, graphes non orientés) et d'outils de calcul adaptés, aboutissant aussi bien à la représentation symbolique "d'états du monde", (le "I" d'information, dans TIC), qu'à des décisions d'(inter)action et de communication (le "C"). C'est ce que nous attendons sans doute des technologies numériques ?

Bonjour Alain,

Une petite voix m'a soufflé d'aller voir ce qui se passait ici ;)

Je vais non pas répondre (de manière définitive) mais discuter certains points que tu soulèves ici fort justement.

- Sur le réalisme de l'ontologie de RDF : c'est un point que tu ne développe pas vraiment par conséquent prenons les choses de biais. Qu'une ontologie soit réaliste, à cette échelle, ne me choque pas. Partir d'un point de vue réaliste permet ensuite de le relativiser. Partir d'emblée dans une perspective non-réaliste conduit en revanche à des résultats à mon sens beaucoup plus hasardeux.

- Concernant le prédicat, je connaît tes réticences et je les partages. Il me semble d'ailleurs que c'est un point qui pourrait/devrait être revu dans la perspectives des discussions autour de RDF 2.0.

Tu écris également ceci :

"me semble passer à côté des résultats d'années de recherche en logique, linguistique et épistémologie. Mais sans doute suis-je influencé par la relecture attentive que je viens de faire du livre de Pierre Jacob, L'intentionnalité: problèmes de philosophie de l'esprit, Odile Jacob, 2004, 978-2738115409."

Quelle logique ? Quelle linguistique ? Je doute, hélas, que la logique suffise à trancher les questions qui se posent à nous. Gautier a dit pourquoi à sa façon. Des logiciens de la classe de Pat Hayes se penchent sur RDF, il ne faut pas croire que l'ignorance domine ici. La logique a d'ailleurs ses propres problèmes, la linguistiques aussi, et il est difficile de leur faire jouer le rôle d'arbitre impartial, à l'abri des soubresauts qui agitent tous les champs du savoir.

Tu parles du contexte épistémologique, mais peut-être les travaux des téléosémanticiens, dont Pierre Jacob (je pense à Dretske, Millikan, etc.), sont-ils en butte à un contexte épistémologique nouveau ! Dans lequel les noms propres ne sont plus des noms propres mais des URIs déréférencable... Dans lequel les conditions de la signification ont changé. Hayes a récemment parlé de "Blogic" pour qualifier sa proposition d'une logique adaptée au Web (contraction de Web Logic).

La question est de savoir si l'artefact, dans sa matérialité, fût-il le ubiquitaire comme le Web, laisse indemne la logique, le langage, l'épistémologie, la philosophie, etc. Personnellement, je ne le pense pas. Je crois qu'une médiation s'instaure nécessairement. Il y a, de ce côté-là aussi, du constituant, comme le dirait Bernard Stiegler. D'ailleurs, on aurait tort de ne considérer que "la logique", universelle et souveraine, quand la réalité nous met au prise avec des logiqueS, au pluriel (cf. Van Heijenoort et Hintikka sur ce point : Language as Calculus vs. Language as Universal Medium).

De même qu'il n'y a pas LE langage comme un donné pur, mais une forme historicisée, en dialogue permanent avec l'évolution des conditions sociales, techniques, et autres.

Venons-en maintenant à ce qui, selon moi, constitue l'essentiel. Tu écris ceci :

"La description d'un événement "ponctuel" à partir de time:DateTimeDescription risque de poser vite un problème de référence "universelle", en particulier pour l'accès à des entités couramment désignées sous la forme de descriptions définies, comme l'Académie française, la famille Hugo (souvenirs de problèmes d'indexation pour l'édition de la correspondance Hugo…)."

Et tu as raison de parler de descriptions définies. Maintenant, cette question est-elle celle de RDF ? RDF, à mon sens, ne pèse guère à côté des URIs et de la notion de ressource.

Savoir comment une URI signifie (et l'on retrouve la question des description définie) voilà la vraie question. Référence directe ? Descriptions définies ? Peut-être les oppositions qui étaient de mise sont-elles aujourd'hui subtilement subvertie dans un contexte épistémologique nouveau.
Disposer d'une ontologie de la ressource viable et prenant en compte ses multiples dimensions temporelles (perdurants, endurants, autre chose ?).

En ce sens, l'on affronte à la fois la question sémantique de la signification, et la question ontologique (la référence opérant peut-être une couture - et non une coupure ;) - entre les deux).

D'où, d'ailleurs, pour ceux qui me connaissent, mon insistance sur l'ontologie IRW de Valentina Presutti et Harry Halpin, ontologie de la ressource, fondamentale, mais qui n'épuise pas le sujet malgré l'admiration que je porte à ces travaux.

Bien sûr, c'est question mériterait d'être davantage développées au plan philosophique, et c'est pourquoi <réclame>je vous donne rendez-vous le 16 octobre prochain à la Sorbonne pour PhiloWeb 2010 </réclame> ;)

"Disposer d'une ontologie de la ressource viable et prenant en compte ses multiples dimensions temporelles (perdurants, endurants, autre chose ?)..." voilà l'autre face d'une même question.

Je m'étais coupé, mes désolées ;)

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
6 + 13 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.