Projets et recherches autour du traitement automatisé du langage et des structures du web.

Structure du web

Depuis novembre 2010, je travaille sur une thèse en traitement automatisé du langage (TAL) à MoDyCo.

Mes recherches portent sur le document textuel sur le web.

☛ Plus d’informations sur mon travail de doctorat sur hypotheses.org.

En décembre 2010, je suis intervenu à l’INA dans le cadre des ateliers sur le dépôt légal du web.

Ma présentation synthétisait mes premières hypothèses de recherche. Les slides sont consultables ici :

L’unité documentaire sur le web.

Pour aller plus loin, vous pouvez consulter la partie théorique de mon projet de recherche.

Elle fait un premier tour des problématiques — texte, document, fichier, auteur, et tout ce qui les relie.

Le texte en miettes

Digital Humanities

Notes de lectures, anecdotes et interrogations sur la trace, notion omniprésente et un peu monolithique à mon goût.

Traces

Canon

Réflexions autour du projet PhotosNormandie et de l’archivage d’objets complexes.

Revoir la Normandie

Où l’on transforme un violoniste en Pullitzer, une expérience sociologique en légende urbaine, et Shakespeare en sarcasme — et tout finit par des posters !

Les oeuvres complètes de William Shakespeare, en poster

Varia

Siza

Fin janvier 2011, j’ai fait une présentation à des élèves de Master de l’ENSAV sur le thème de l’architecture procédurale.

Consulter les slides

Le buzz est une dynamique, un ensemble de comportements interdépendants plutôt qu’à une situation précisément délimitable. Pour y voir plus clair, décortiquons méthodiquement un bon gros buzz :

La photo de Zahia et Ribéry

Une petite présentation détaillant les principes du classificateur d’URL que j’ai réalisé pendant mon stage de fin de Master.

Ce type de prototype léger permet de valider les approches théoriques avant de se lancer dans un développement à grande échelle.

Classification automatique d’URL