Les petites cases

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

La partie « Utilisateurs »

Si vous possédez un compte Yahoo!, vous pouvez d’ors et déjà, après connexion, choisir et installer des résultats personnalisés à partir de la « search Gallery » mis à la disposition des utilisateurs par Yahoo.

page d'accueil de Yahoo search gallery
Page d’accueil de la « Yahoo! Search Gallery »

page de l'application Linkedin
Page de l'application Linkedin

Une fois que vous avez choisi les personnalisations que vous souhaitez utiliser, vous pouvez lancer une recherche. Si un des résultats correspond à une des pages prise en charge par une des applications, vous verrez apparaître le résultat personnalisé.

Résultat personnalisé avec Linkedin
Résultat personnalisé avec Linkedin

Résultat personnalisé pour LastFM
Résultat personnalisé pour LastFM

Résultat personnalisé pour Feedbooks
Résultat personnalisé pour Feedbooks

En utilisant la structuration des données d'une page Web, Yahoo! ouvre avec SearchMonkey la possibilité aux utilisateurs d'être mieux renseigné sur la page donnée en résultat. Or, sans même y faire attention, nous accordons de l'importance à l'extrait mis à disposition par le moteur de recherche, avant de cliquer sur le lien. Ainsi, sans même toucher à son algorithme et, en ouvrant un peu sa plate-forme de recherche aux développeurs de tous les horizons, Yahoo améliore les résultats de la recherche. Et, grâce à quoi, je vous le donne en mille : la structuration des données avec des formats issues ou apparentées aux technologies du Web sémantique.

Dans le prochain billet, nous rentrerons dans les arcanes de la plate-forme et étudierons comment créer une nouvelle application. Pour cela, je prendrais appui sur les données encodées en RDFa sur ce blog et quelques autres. Restez branchés, nous sommes en train de vivre une période formidable !

Essai 2

Causeries Indexation Moteur de recherche RDFa — 

Commentaires

À ce propos est-ce que justement les gens ne vont pas bidonner leur métas de manière à foutre complétement le dawa dans la recherche et la rendre plus compliqué ou penses-tu que le précédent argument souvent évoqué est une fausse peur, un peu comme celle qui voudrait qu'on puisse bidonner Wikipedia du fait que tout le monde peut écrire dedans ?

Je pense que les ingénieurs de Yahoo ont très bien réfléchi à cette question d'où l'architecture de leur plate-forme de développement, donc plusieurs réponses :

  • Les données structurées exploitées par SearchMonkey n'entrent pas dans le calcul de la pertinence (du moins ils ne le disent pas si c'est le cas, ils ne sont pas fous ;-) ) ;
  • Une application qui personnalise les résultats est limitée à un ensemble d'URLs déterminés par le développeur (j'y reviendrai dans le prochain billet), cela évite d'avoir un comportement sur tous les sites Web du monde ;
  • Chaque utilisateur est libre de choisir telle ou telle personnalisation et peut la désactiver à tout moment, il est donc de sa responsabilité s'il met le "dawa", comme tu dis, dans sa page de recherche, cela n'affecte pas tous les utilisateurs.

Comme tu le vois, les équipes de Yahoo ! ont largement limité les risques que tu évoques. Par ailleurs, cet argument me semble fallacieux voire dangereux. C'est exactement cet argument qu'a utilisé Google pendant des années contre le Web sémantique et qui a fait perdre de précieuses années à ce dernier. Bref, l'approche de Yahoo me paraît, de ce point de vue, tout à fait original et montre qu'il fallait dépasser cet éventuel problème pour offrir de nouvelles fonctionnalités grâce aux données structurées.

PS : Tu pourrais préciser ton adresse mail dans les commentaires, je connais plusieurs Nicolas et j'aime bien à savoir à qui je m'adresse. Merci :-)

Ho c'était ce Nicolas là désolé :-). Merci pour ta réponse, tu m'as dit exactement ce que je voulais savoir et donné envie de regarder ce projet de près.
J'ai été franchement un peu déçu à la création de l'application pour Feedbooks de n'avoir eu le choix que de faire du XSLT plutôt que d'employer du RDFa (c'est pour bientôt le RDFa: http://developer.yahoo.net/blog/archives/2008/05/rdf_and_the_mon.html ), mais ceci mis à part, SearchMonkey est une initiative à surveiller de très près. Quand Yahoo se réveille, ils savent mettre au point des services innovants (Pipes par exemple). Après, ce qui fait aussi la différence, c'est la manière d'intégrer ces nouveautés. Si SearchMonkey se contente d'un système d'installation d'applications, plutôt que d'utiliser de manière native certaines de ces applications, ils auront gâché un potentiel incroyable.
J'aborderai la question de la création d'application dans le prochain billet, mais je partage votre analyse. Maintenant, il faut savoir être patient, ce ne sont que les balbutiements, il reste pas mal de travail, mais Yahoo a vraiment inventé quelque chose de nouveau à fort potentiel avec SearchMonkey. Pour l'insertion de manière native de certaines applications, Yahoo ! tient là un bon moyen de monétiser SearchMonkey. On en reparle dans quelques mois ! Seriez-vous prêts à payer chez Feedbooks pour que votre appli soit utilisé de manière native ?
Merci pour le lien.
Bonjour, J'ai découvert votre site. Je cherchais des infos sur le websemantique, un ami m'a donné votre url. Balèze ! (même si j'ai malocrane après certaines lecture, j'suis pas dev) Merci et bonne continuation.
De rien, merci pour votre commentaire et vos encouragements et désolé pour votre crâne...
Juste une petite note pour dire que le support RDFa est désormais disponible.
Merci pour l'info ! J'avais entraperçu le support sur l'interface de développement, mais je n'ai pas encore eu l'occasion de jouer avec. Cela me fait penser qu'il faut que j'écrive la suite de ce billet !