La fouille de textes et la visualisation de données

L’augmentation de la vitesse de calcul des ordinateurs et la création de grands corpus de données numériques permet depuis peu de mener des projets de recherche avancée dans le domaine des humanités numériques. Les informations recueillies doivent cependant être traitées, catégorisées, sélectionnées puis mises en forme afin d’être exploitable. C’est le travail de fouille de textes et de visualisation de données.

Dominic Forest, professeur agrégé à l’École de bibliothéconomie et des sciences de l’information de l’Université de Montréal, nous présente les grandes étapes et les principaux objectifs de cette pratique.

Pour aller plus loin :

Méthodologie de fouille des textes – graphique

Fouille de textes et cartographie thématique des corpus numériques, présentation de Dominic Forest et Marcela Baiocchi donnée dans le cadre du colloque « Une plateforme de recherche et d’expérimentation pour l’édition ouverte », organisé le 25 mai 2015 au congrès de l’ACFAS.

Extraction automatique et visualisation des thèmes abordés dans des résumés de mémoires et de thèses en anthropologie au Québec, de 1985 à 2009, mémoire de maîtrise de Anne-renée Samson, 2013, Université de Montréal. Version numérique consultable à l’adresse: http://hdl.handle.net/1866/10440

Enjeux de la diffusion savante

Découvrez les grands enjeux auxquels fait face la diffusion savante à travers une série d’entrevues réalisées par Érudit avec des acteurs clés du milieu de la recherche canadienne.

Autre enjeu: Rôle des presses universitaires à l’heure du numérique, avec Benoît Melançon, directeur scientifique des Presses de l’Université de Montréal.