Le temps et le courage me manquent pour alimenter sérieusement ce blog. Si, aujourd'hui, je sors de mon silence, c'est pour pousser une énorme coup de gueule. Alors qu'on nous bassine tous les jours avec l'Open Data et ses promesses tant citoyennes qu'économiques, je constate tous les jours un peu plus le chemin encore gigantesque à parcourir pour exploiter professionnellement et sur le long terme un ensemble de données (dataset) mis à disposition sur data.gouv.fr ou tout autre site équivalent.
Un exemple vaut mieux que des grands discours pour illustrer mon courroux : le recensement des équipements sportifs sur le site data.gouv.fr. Cet ensemble de données est mis à disposition sous la forme d'un fichier zip contenant un fichier XML depuis le 15 juin 2012. Il s'avère que pour les besoins d'un prototype que nous avons mis au point chez Antidot pour démontrer les capacités de nos produits, nous l'avions utilisé. La récupération et le traitement de ce fichier ont donc été paramétrés par rapport à la première version du fichier. Or, il a été mis à jour, il y a quelques jours (le 21 février 2013 pour être précis). Nous pensions donc (naïvement, comme vous pourrez le constater) qu'il nous suffirait de relancer notre chaîne de traitement pour prendre en compte cette nouvelle version. C'était sans compter les nombreux petits changements qu'avait subis entre temps cet ensemble de données :