Ce projet s'insère dans le domaine de la fouille de textes et contribue aux domaines de l'analyse, de l'organisation et de la visualisation des connaissances à partir de documents textuels. Plus spécifiquement, le projet cherche à développer et à valider une méthodologie et un prototype d’application hybride fondé sur des techniques de fouille de textes pour assister informatiquement l’extraction, la structuration et la représentation des connaissances à partir de documents textuels.
L’originalité du projet réside dans l’arrimage qu’il entend effectuer entre des concepts et des méthodologies de fouille de textes provenant, d’une part, des recherches sur la classification et sur la catégorisation des données textuelles et, d’autre part, des recherches théoriques et appliquées dans les domaines de la linguistique informatique et de la terminologie computationnelle. L’approche hybride proposée permet de bénéficier des avantages des approches numériques à des fins de structuration de l’information, mais aussi des avantages des approches linguistiques permettant d’assister l’extraction des termes pertinents et l’identification des différentes relations sémantiques entre ces derniers. Une partie importante de ce projet réside dans l’exploration de modalités de représentations des connaissances présentes dans les corpus de documents textuels.
La demande de subvention présentée par D. Forest a été classée au premier rang par le comité disciplinaire, ce qui lui a valu d’être en nomination pour le prix Aurore attribué annuellement au meilleur chercheur ayant obtenu une subvention ordinaire de recherche à titre de nouveau chercheur (annonce des résultats et attribution du prix : automne 2008).