Les petites cases

« Crimes » d'après noël, les Lego et l'aspirateur

-Ici, j'ai un filtre à Lego pour aspirateur. Tu savais que l'équivalent d'un million de livres sterling de Lego sont aspirées chaque année, et que dix mille heures de main-d'œuvre sont perdues à fouiller dans les sacs à poussière ?

-Non, je ne savais pas.

-Cet appareil trie les Lego avalés par forme et par couleur, selon la position que tu vois là.

Jasper Fforde, Délivrez-moi, éd. Fleuve noir, Paris, 2005, p.95.

Qui n'a pas fait cette amère expérience du Lego avalé par l'aspirateur ? Drâme de l'enfant et horreur de l'adulte qui doit faire attention à ces petites pièces...

L'appareil de l'oncle Mycroft pourrait nous rendre de grands services, malheureusement ce n'est qu'une fiction (quoique...). Alors, après Noël, pensez à ne pas avaler les pièces de Lego qui traînent, cela pourrait empêcher la construction du nouveau wing fighter 6207. Merci pour eux ;-)

Au passage, petit message pour les enfants (il n'y a pas de raison), pensez à ranger vos Lego, c'est pénible de faire attention ;-).

Lire la suite...

Causeries — 

Propositions de stages : Web services, statistiques textuelles et ontologies

Comme les étudiants de l'Université technologique de Troyes n'ont pas l'air intéressés par les stages que je propose, je me suis décidé à les proposer ouvertement sur mon blog. Je propose donc deux stages rémunérés (500 € nets par mois) à l'École nationale des chartes pour une durée maximale de six mois. Ces stages sont parfaits pour un projet de fin d'études d'école d'ingénieurs ou pour des Master 2, mais je suis ouvert aux propositions.

Le premier stage a pour but le développement ou l'amélioration d'outils pour les chercheurs en histoire. D'après ce que j'ai prévu, deux tâches se dégagent :

  1. Créer des fonctionnalités supplémentaires au logiciel eXist : base de données XML native open source en java, qui permet de faire des interrogations en Xquery. Il faudra développer des fonctionnalités pour effectuer de la statistique textuelle (calcul des collocations, comptages de formes, emplacement des formes...) ;

  2. Mettre au point des Web-services en SOAP ou en REST pour permettre l'interrogation à distance d'une base de données bibliographiques et d'un dictionnaire. Il faudra aussi développer l'API qui permettra d'accéder facilement au web service.

Pour ce

Lire la suite...

Web sémantique Causeries Histoire OWL XSLT — 

Structurer, décrire et organiser l'information (2)

Ce billet constitue la suite du billet dédié à la structuration de l'information (voir aussi le troisièmes billet : comment organiser l'information pour y naviguer efficacement ?).

Lire la suite...

RDF XML Causeries Indexation OWL —  1 commentaire

La DADVSI, la lutte continue

http://www.homo-numericus.net/

Comme Pierre l'explique dans un billet qui fait parfaitement le point sur les problème que pose cette loi, il a fait passer Homo numericus en mode "Combat contre la DADVSI', à l'image des sites Web liés aux logiciels libres pendant la bataille contre les brevets logiciels. Et, comme vous le lirez dans son billet, je rappelle que l'heure est grave !! Il met donc à disposition ce kit pour le placer sur votre site Web (je vais voir ce que je peux faire ce week-end).

Au chapitre des actualités de la résistance à la DADVSI, outre la pétition d'EUCD, Culture et TIC rappelle la pétition de l'interassociation des bibliothécaires, documentalistes et archivistes et signale sur leur site les cinq amendements proposés aux députés. Je vous en conseille la lecture, car,

Lire la suite...

Râleries — 

Structurer, décrire et organiser l'information (1)

On a tendance à confondre les trois actes recouverts par les verbes : structurer, décrire et organiser. S'il est incontestable que leur sens est proche, ces verbes désignent dans le processus de création de l'information sur le support numérique des actions qu'il est essentiel de différencier. S'ils ne sont pas dissociés, il existe des risques d'amalgames conduisant à des mauvais choix technologiques.

Je vous propose une série de trois billets permettant de faire le point sur ce problème :

Lire la suite...

Structuration Web sémantique XML Causeries

Défendons nos droits et nos libertés

http://eucd.info

L'heure est grave et il est grand temps de crier haut et fort et de réagir contre ce que le gouvernement à la botte des lobbys culturo-industriels (je ne sais même pas s'il mérite le culturo...), bref les majors, essayent de faire passer en douce : la DADVSI, la loi sur les droits d'auteurs, censé être la transposition de la directive européenne sur les droits d'auteurs.

Le site EUCD co-fondé par Christophe Espern, de Creative Commons France, et sous-titré : "Sauvons le droit d'auteurs' explique très bien les problèmes posés :

Lire la suite...

Râleries — 

Allier les avantages des signets partagés et de RSS

Vous connaissez tous delicious, le site de signets partagés. Si vous ne connaissez pas encore, je vous renvoie au billet de Piotrr : « Les mystères de la folksonomy ». Ce week-end, j'ai découvert une fonctionnalité que je ne connaissais pas et qui d'ailleurs répondra aux interrogations de Piotrr. Dans votre compte delicious, il existe une partie qui s'appelle Inbox.

Image1

Vous pouvez y recevoir les signets référencés par une personne, avec un tag particulier ou avec un tag particulier d'une personne. En gros, c'est une boîte aux lettres de signets en fonction de critères que vous déterminez. Là où ça devient intéressant, c'est que vous pouvez recevoir le contenu de cet « Inbox » par fil RSS. Jusqu'à maintenant, je suivais plusieurs comptes delicious et un tag avec les fils RSS respectifs. Grâce à ce système, j'ai pu les rassembler dans un seul fil auquel j'ai ajouté quelques tags (OWL, TEI comme par hasard...).

Ainsi, la veille devient un vrai jeu d'enfant, plus d'excuses de temps ou de recherches longues et fastidieuses (le push est toujours plus agréable pour l'utilisateur que le pull ;-) ). A mon avis, delicious montre toutes ces possibilités et ces avantages

Lire la suite...

Causeries — 

Sémantique et XHTML

Contrairement à ce que dit un abus de langage répandu, une page Web n'est pas sémantisée, lorsqu'elle est encodée selon la norme XHTML. Si je reprends la définition de Wikipedia, la sémantique est une branche de la linguistique qui étudie les signifiés, c'est à dire le sens des mots et d'après mon vieux Petit Larousse 1994, la sémantique désigne ce qui est relatif au sens, à la signification des unités linguistiques.

Lire la suite...

Structuration Web sémantique XHTML XSLT Geekeries —  2 commentaires

Validation de l'information et journalisme

http://soufron.typhon.net/article.php3?id_article=105

Alors que je racontais, il y a peu, une expérience d'un journaliste américain qui était impressionné par le travail de la communauté de Wikipedia, une journaliste (??) française, Ariane Massenet, a, quant à elle, voulu montrer à quel point wikipedia et sa méthode ouverte et sa validation a-posteriori représentait le mal absolu. Elle a donc introduit une erreur dans une notice pendant une émission. Mais, comme le raconte cet excellent article de Jean-Baptiste Soufron, elle n'a pas signalé que moins d'une minute plus tard, l'erreur avait été corrigée.... C'est peut-être cela qu'on appelle la validation de l'information en journalisme et la conscience journalistique.

Lire la suite...

Validation Wikipedia Râleries — 

Un nouveau groupe de travail pour les interfaces Web enrichies au W3C

http://www.w3.org/2006/appformats/

Voici une annonce qui devrait ravir beaucoup de mondes à commencer par Fred Cavazza, Tristan Nitot, Laurent Jouanneau et d'autres. Le W3C annonce la constitution d'un groupe de travail pour la mise au point d'un langage pour les interfaces Web enrichies. Pour faire rapide (ça me changera ;-) ), il s'agit de mettre un peu d'ordre au milieu d'une offre de plus en plus importantes dans ce secteur. A la suite de XUL, inventé par la mozilla foundation pour les interfaces de leurs produits dont Firefox, Microsoft annonce XAML à la base du prochain Windows, et Macromedia propose quant à lui MXML.

Espérons que le W3C réussira dans son entreprise de s'appuyer sur l'existant (« This deliverable should be based on an existing application/UI format ») et qu'il n'est déjà pas trop tard...

A signaler que cette annonce fait aussi état d'un autre groupe de travail dont le but est le développement d'une API standard pour le développement des applications Web clientes et dont la première tâche sera la documentation de XMLHttpRequest à la base d'AJAX.

Via Le fil RSS des nouveautés du W3C

Lire la suite...

XML Web Geekeries —