Les petites cases

Et si on sémantisait un peu le Web

Commentaires

On parle souvent des technologies qui permettent de "sémantiser le web", de lui "donner du sens". Pourtant, le web a déjà beaucoup de sens, et c'est ce qui fait que bien avant l'arrivée de ces technos on a pu s'y intéresser et passer des heures à naviguer de site en site.
Le sens est déjà là, et le problème est simplement que nos machines ne sont pas assez puissantes, et nos algorithmes assez bons, pour que la compréhension automatisée des documents textes soit aussi bonne que la nôtre, et c'est pourquoi nous sommes obligés de rajouter des quantités de méta-données un peu partout.

Exemple typique d'élément texte à forte valeur sémantique : une adresse email modifiée pour ne pour ne pas être interprétée par un automate (type nom [dot] prenom [at] domaine [dot] com). Tout le monde comprend qu'il s'agit d'une adresse mail en la voyant, le sens est donc bien présent. Pourtant, les automates qui parcourent les pages à la recherche d'adresses seraient bernés par une si petite protection, c'est dire leur faible capacité à interpréter le texte.

Je pense qu'on devrait garder en tête que ce qui existe sur le web a déjà du sens et que les méta données qu'on y ajoute ne sont que des palliatifs à l'intelligence des automates. Le but de l'informatique est de satisfaire notre paresse et d'éviter les tâches répétitives, mais mettre des tags partout, même sur un bout de texte aussi simple qu'une adresse email ne nous facilite pas beaucoup la vie. J'imagine déjà les méta données spatiales, où pour chaque image publiée on sera obligé de dire "ici, une personne âgée, habillée en rouge.... là, un chien dans son panier..." tout ça pour qu'elle puisse être utilisée par les moteurs de recherche.

Je ne pense pas que l'avalanche de méta données soit l'unique solution.

Petite précision : je n'ai jamais dit que le Web en lui-même n'avait aucun sens, heureusement que, pour nous autres humains, il a du sens. Il est bien question dans mon billet d'ajouter des métadonnées, en vue d'aider les machines dans leur quête de sens. Evidemment, dans cette longue quête, les métadonnées ne constituent pas elles seules le saint-graal ;-)
Un triplet, en français, désigne une ensemble ordonné de trois éléments. Le triple est le produit d'un nombre par 3... Merci pour ce article clair ;-)

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
2 + 3 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.