Contexte : le projet s'inscrit dans le domaine de la fouille de textes et de la visualisation de l'information appliquées aux sciences humaines numériques. Avec l'essor des technologies numériques, les pratiques de recherche dans les sciences humaines sont en constante mutation. Les chercheurs tentent de tirer profit des avantages qu'offre la documentation numérique. Cependant, la quantité d'informations disponibles en format numérique soulève d'importants enjeux auxquels aucune solution définitive n'a été proposée.
Objectifs : le projet consiste à évaluer la pertinence d'employer des stratégies de fouille de textes (algorithmes d'apprentissage-machine supervisés et non supervisés) pour assister des tâches d'extraction, d'organisation et de visualisation d'informations à partir de gros corpus
documentaires en sciences humaines. Plus spécifiquement, les objectifs de ce projet consistent à 1) développer un prototype d'application en ligne, flexible et convivial à partir d'applications de fouille de données ouvertes (mais qui nécessitent des connaissances techniques très pointues), afin de permettre à la communauté de chercheurs en sciences humaines d'extraire et de structurer automatiquement les informations importantes dans des corpus documentaires, 2) concevoir différentes démarches méthodologiques de fouille de textes adaptées aux besoins des chercheurs en sciences humaines et 3) évaluer comment certaines techniques de fouille de textes peuvent être employées pour assister l'analyse et l'interprétation des documents textuels dans le domaine des sciences humaines. Ce projet de recherche implique donc une interrelation entre un développement technologique (une plate-forme flexible et ergonomique de fouille de textes adaptée au traitement de corpus en sciences humaines) et une modélisation des besoins technologiques des chercheurs en sciences humaines.
Dominic Forest étant désormais membre associé de Figura, ce programme ne fait plus partie de la programmation scientifique du Centre.