exit

Information et communication   > Accueil   > Recherche d’information, document et web sémantique   > Numéro 1   > Article

Indexation d’articles scientifiques Présentation et résultats du défi fouille de textes DEFT 2016

Automatic indexing of scientific papers Presentation and results of DEFT 2016 text mining challenge


Béatrice Daille
LS2N - Université de Nantes

Sabine Barreaux
INIST–CNRS

Adrien Bougouin
LS2N - Université de Nantes

Florian Boudin
LS2N - Université de Nantes

Damien Cram
LS2N - Université de Nantes

Amir Hazem
LS2N - Université de Nantes



Publié le 9 janvier 2018   DOI : 10.21494/ISTE.OP.2018.0209

Résumé

Abstract

Mots-clés

Keywords

Cet article décrit la campagne 2016 du défi fouille de textes (DEFT), qui pour sa douzième édition a proposé aux participants de simuler la tâche d’indexation de documents scientifiques réalisée par des documentalistes, experts dans des domaines de spécialité. L’indexation consiste à proposer un ensemble de mots-clés pour une notice bibliographique, en français, de quatre domaines de spécialité (linguistique, sciences de l’information, archéologie et chimie). Cette tâche d’indexation de document scientifique est difficile qu’elle soit réalisée manuellement ou automatiquement. Nous présentons la pratique de l’indexation manuelle et les méthodes état de l’art pour l’indexation automatique ainsi que leurs évaluations. Nous décrivons ensuite les données mises à disposition des participants, le déroulement de la campagne et les résultats obtenus évalués avec les mesures de précision, rappel, et f1-mesure, calculées avec une macro-moyenne.

This paper presents the 2016 edition of the DEFT text mining challenge. This edition adresses the keyword-based indexing of scientific papers with the aim of simulating a professional indexer. The corpus is composed of French bibliographic records from four domains : linguistics, information science, archaeology and chemisty. The results have been evaluated in terms of precision, recall and f-measure computed on stemmed texts against a reference manual indexation.

indexation automatique mot-clé domaines de spécialité articles scientifiques français

document indexing keyphrase specialized domains scientific aricles French