exit

Information and Communication   > Home   > Information Retrieval, Document and Semantic Web   > Issue 1   > Article

A graph-based ranking approach for indexing in specialised domains

Modélisation à base de graphe pour l’indexation en domaines de spécialité


Adrien Bougouin
LS2N - Université de Nantes

Florian Boudin
LS2N - Université de Nantes

Béatrice Daille
LS2N - Université de Nantes



Published on 9 January 2018   DOI : 10.21494/ISTE.OP.2018.0210

Abstract

Résumé

Keywords

Mots-clés

This article presents the participation of the TALN group at LINA to the défi fouille de textes (DEFT) 2016. Developed specifically for automatic keyphrase annotation, we propose a new method, TopicCoRank, extracting the most important phrases from a document and providing key-phrases that do not occur in the document. Our system ranked third out of a total of five systems.

Cet article présente la participation de l’équipe TALN du LINA au défi fouille de textes (DEFT) 2016. Pour la tâche d’indexation de documents de domaines de spécialité par l’intermédiaire de leurs mots-clés, nous avons proposé une méthode à base de graphe, TopicCoRank, dans la lignée des approches à base de graphes proposées en recherche d’information. TopicCoRank modélise les informations présentes dans le document et la connaissance du domaine pour réaliser une indexation plus exhaustive et respectueuse du vocabulaire du domaine. Notre système s’est classé à la troisième place quel que soit le domaine de spécialité.

DEFT 2016 keyphrase extraction keyphrase assignment graph-based method specific domain

DEFT 2016 extraction de mots-clés assignation de mots-clés méthode à base de graphe domaine de spécialité