Propulsé par Drupal

Exploration de méthodologies hybrides pour l’extraction, l’organisation et l’exploitation de connaissances à partir de documents textuels

Projet de recherche

Période d'activité: 
2008 - 2009
Chercheur principal membre: 

Ce projet s'insère dans le domaine de la fouille de textes et contribue aux domaines de l'analyse, de l'organisation et de la visualisation des connaissances à partir de documents textuels. Plus spécifiquement, le projet cherche à développer et à valider une méthodologie et un prototype d’application hybride fondé sur des techniques de fouille de textes pour assister informatiquement l’extraction, la structuration et la représentation des connaissances à partir de documents textuels.

L’originalité du projet réside dans l’arrimage qu’il entend effectuer entre des concepts et des méthodologies de fouille de textes provenant, d’une part, des recherches sur la classification et la catégorisation des données textuelles et, d’autre part, des recherches théoriques et appliquées dans les domaines de la linguistique informatique et de la terminologie computationnelle. L’approche hybride proposée permet de bénéficier des avantages des approches numériques à des fins de structuration de l’information, mais aussi des avantages des approches linguistiques permettant d’assister l’extraction des termes pertinents et l’identification des différentes relations sémantiques entre ces derniers. Une partie importante de ce projet réside dans l’exploration de modalités de représentations des connaissances présentes dans les corpus de documents textuels.