exit

Information et communication   > Accueil   > Recherche d’information, document et web sémantique   > Numéro 1   > Article

Modélisation à base de graphe pour l’indexation en domaines de spécialité

A graph-based ranking approach for indexing in specialised domains


Adrien Bougouin
LS2N - Université de Nantes

Florian Boudin
LS2N - Université de Nantes

Béatrice Daille
LS2N - Université de Nantes



Publié le 9 janvier 2018   DOI : 10.21494/ISTE.OP.2018.0210

Résumé

Abstract

Mots-clés

Keywords

Cet article présente la participation de l’équipe TALN du LINA au défi fouille de textes (DEFT) 2016. Pour la tâche d’indexation de documents de domaines de spécialité par l’intermédiaire de leurs mots-clés, nous avons proposé une méthode à base de graphe, TopicCoRank, dans la lignée des approches à base de graphes proposées en recherche d’information. TopicCoRank modélise les informations présentes dans le document et la connaissance du domaine pour réaliser une indexation plus exhaustive et respectueuse du vocabulaire du domaine. Notre système s’est classé à la troisième place quel que soit le domaine de spécialité.

This article presents the participation of the TALN group at LINA to the défi fouille de textes (DEFT) 2016. Developed specifically for automatic keyphrase annotation, we propose a new method, TopicCoRank, extracting the most important phrases from a document and providing key-phrases that do not occur in the document. Our system ranked third out of a total of five systems.

DEFT 2016 extraction de mots-clés assignation de mots-clés méthode à base de graphe domaine de spécialité

DEFT 2016 keyphrase extraction keyphrase assignment graph-based method specific domain