Les petites cases

Web sémantique, utilisateurs, stupidité et Google

Commentaires

Non seulement les utilisateurs sont incompétents mais en plus, et c'est une des raisons pour lesquelles google n'aime pas les métadonnées : les utilisateurs mentent et trichent. Il y a quelques années les sites avec "mp3, sexe, casino" dans les mots clés étaient légion, même si les sites n'avaient rien à voir avec ces sujets. Résultat ? on n'utilise plus le champ mot clé pour l'indexation et on se base uniquement sur le contenu réel visible par le lecteur (quitte à ce que cette indexation soit moins bonne). Tout ceci ne veut pas dire que le Web Sémantique est mauvais, mais simplement qu'il ne peut pas être la solution à toutes les problématique, et peut être pas celle d'un moteur de recherche grand public.
Je suis assez d'accord avec vous et c'était bien le sens de la remarque de Peter Norvig. Malheureusement, il y aura toujours des tricheurs dans un système aussi ouvert que le Web. Mais, ce n'est pas tant la remarque de Peter Norvig que la manière de le dire surtout en face de Tim Berners-Lee qui m'a choqué, je trouve cela dommage que le plus important moteur de recherche fasse des généralités et mette de côté les technologies du web sémantique au prétexte que certains abusent du système.
De plus, tous les webmasters ne sont pas incompétents. Il me semble qu'il y a quelques années (et vous êtes bien placés pour le savoir ;-) ), on disait la même chose pour le passage des tableaux au full CSS et, finalement, force est de constater que les choses ont évolué.
Pour revenir au Web sémantique, je voudrais ajouter deux choses. Il est presque évident que ces technologies ne sont pas toutes à destination du grand public et qu'elles sont pour la plupart destinées à des communautés bien précises, essentiellement issues des milieux professionnels, de la recherche et de la documentation en général (bibliothèque, archives et centres de documentation). Mais, ce n'est pas une raison pour les dénigrer de cette façon. Surtout, et c'est le sens de ma deuxième remarque (et d'ailleurs de la réponse de Tim Berners-Lee), le Web sémantique intègre la notion de confiance. Les moteurs qui utiliseraient ces techonoloies sémantique devront être en mesure d'identifier la source de l'information et de la traiter en conséquence. Lorsqu'une bibliothèque mettra par exemple à disposition un thésaurus en SKOS, elle constituera une source digne de confiance et les développeurs pourront être en mesure d'appuyer des logiciels d'extraction de l'information, des interfaces de recherche ou de tagging sur ce thésaurus. Je ne pense pas qu'on puisse se satisfaire complètement des résultats proposés par Google, ils sont certes les plus pertinents aujourd'hui, mais imaginons les possibilités avec des moteurs réellement sémantiques.

Poster un nouveau commentaire

Le contenu de ce champ ne sera pas montré publiquement.
  • Les adresses de pages web et de messagerie électronique sont transformées en liens automatiquement.
  • Allowed HTML tags: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Les lignes et les paragraphes vont à la ligne automatiquement.
  • You may post code using <code>...</code> (generic) or <?php ... ?> (highlighted PHP) tags.

Plus d'informations sur les options de formatage

CAPTCHA
This question is for testing whether you are a human visitor and to prevent automated spam submissions.
5 + 11 =
Solve this simple math problem and enter the result. E.g. for 1+3, enter 4.