Les petites cases

Propositions de stages : Web services, statistiques textuelles et ontologies

Comme les étudiants de l'Université technologique de Troyes n'ont pas l'air intéressés par les stages que je propose, je me suis décidé à les proposer ouvertement sur mon blog. Je propose donc deux stages rémunérés (500 € nets par mois) à l'École nationale des chartes pour une durée maximale de six mois. Ces stages sont parfaits pour un projet de fin d'études d'école d'ingénieurs ou pour des Master 2, mais je suis ouvert aux propositions.

Le premier stage a pour but le développement ou l'amélioration d'outils pour les chercheurs en histoire. D'après ce que j'ai prévu, deux tâches se dégagent :

  1. Créer des fonctionnalités supplémentaires au logiciel eXist : base de données XML native open source en java, qui permet de faire des interrogations en Xquery. Il faudra développer des fonctionnalités pour effectuer de la statistique textuelle (calcul des collocations, comptages de formes, emplacement des formes...) ;

  2. Mettre au point des Web-services en SOAP ou en REST pour permettre l'interrogation à distance d'une base de données bibliographiques et d'un dictionnaire. Il faudra aussi développer l'API qui permettra d'accéder facilement au web service.

Pour ce stage, une bonne connaissance du Web, de java, du couple XHTML/CSS et de PHP est obligatoire. Si vous connaissez aussi XSLT voire Xquery ou SOAP, ce serait parfait.

Le second stage a pour but le développement d'une ontologie et des outils ad-hoc pour l'exploiter et la visualiser afin d'analyser les réseaux sociaux dans un corpus historique. Le stage s'articulera en trois parties :

  1. La mise au point de l'ontologie en OWL ;

  2. Le développement des outils pour peupler l'ontologie à partir de l'indexation des textes encodés en TEI ;

  3. Développement des outils pour visualiser l'ontologie intégrant un raisonneur pour effectuer automatiquement les inférences.

Evidemment, il faut connaître les technologies de base du Web (XHTML, CSS, XML, XSL) et des langages de programmation (java, PHP). Si vous connaissez la logique et/ou les concepts et technologies de base du Web sémantique, c'est un plus, mais je ne rêve pas. Il faut par ailleurs avoir de l'intérêt pour l'histoire et la généalogie.

Vous travaillerez au sein du service Recherche et valorisation sous ma responsabilité, je ne mords pas et les deux précédents stagiaires travaillent encore à l'École ;-). Je précise qu'une personne s'est déjà portée candidate.

Si vous êtes intéressés ou que vous avez des questions, n'hésitez pas à me contacter.

Web sémantique Causeries Histoire OWL XSLT —