TY - Type of reference TI - Exploitation de l’hétérogénéité dans les données textuelles AU - Jacques Fize AU - Mathieu Roche AU - Maguelonne Teisseire AB - Depuis plusieurs décennies, on observe une utilisation croissante des systèmes d’information, ce qui provoque une augmentation exponentielle des données textuelles. Bien que l’aspect volumétrique de ces données textuelles soit résolu, sa dimension hétérogène reste un défi pour la communauté scientifique. La maitrise de ces données hétérogènes offre de nombreuses opportunités par un accès à une information plus riche. Dans nos travaux, nous concevons un processus de mise en correspondance de données textuelles hétérogènes, basé sur leur spatialité. Dans cet article, nous présentons les résultats retournés par ce processus sur des données produites à Madagascar dans le cadre du projet BVLAC, dirigé par le CIRAD. En se basant sur un ensemble de 4 critères de qualité, nous obtenons de bonnes correspondances spatiales entre ces documents. DO - 10.21494/ISTE.OP.2019.0334 JF - Recherche d’information, document et web sémantique KW - Fouille de texte, similarité spatiale, représentation spatiale, text-mining, spatial similarity, spatial representation, L1 - http://www.openscience.fr/IMG/pdf/iste_ridows18v2n1_4.pdf LA - fr PB - ISTE OpenScience DA - 2019/02/19 SN - 2516-3280 TT - Harness the hetorogeneity in textual data UR - http://www.openscience.fr/Exploitation-de-l-heterogeneite-dans-les-donnees-textuelles IS - Numéro 1 VL - 2 ER -