exit

Social Sciences and Humanities   > Home   > Digital Archaeology   > Issue 1   > Article

Data visualisation in archaeology based on graph approach. Operational meeting of ArkeoGIS archaeologists and IndexMed ecologists

Visualisation de données sous forme de graphes en archéologie. Rencontre opérationnelle des archéologues d’ArkeoGIS et des écologues d’IndexMed


Romain David
Aix Marseille Université et Université d’Avignon

Loup Bernard
Université de Strasbourg

Cyrille Blanpain
Aix Marseille Université

Alrick Dias
Aix Marseille Université et Université d’Avignon

Jean-Pierre Féral
Aix Marseille Université et Université d’Avignon

Sophie Gachet
Aix Marseille Université et Université d’Avignon

Julien Lecubin
Aix Marseille Université

Christian Surace
Aix Marseille Université

Thierry Tatoni
Aix Marseille Université et Université d’Avignon



Published on 13 October 2017   DOI :

Abstract

Résumé

Keywords

Mots-clés

The one thing in common “archaeological”, “biodiversity” or “social systems” studies share is that data production is both expensive and few automated. Long time series and / or large spatial surveys are difficult to conduct, since it is necessary to use several observers. The robustness and reproducibility of the observation are also harder to get and is obviously impossible in archaeological sciences, even if modeling methods are improved. In a context of multi-source data production, the equivalence of observation systems and the inter-calibration of the observers become crucial. Multi-disciplinary integrative approaches become necessary to study systems where the output of data, in each discipline, is discontinuous, imprecise and poorly distributed. Yet, all variables (characterization of economic activities and human installation, productions studies, characteristics of the discovered or reconstituted objects, biotic or abiotic data, maps of anthropogenic and natural pressures, rendered services and feelings, societal perception...) of these systems interact over time and at each spatial scale. After a few years of existence, ArkeoGIS aggregates 67 databases representing over 50 000 objects (sites, analyzes...). With this standardization of archaeological and paleoenvironmental information, it seemed important to test new data mining methods, to see whether "related" and complex data can be linked to these archaeological data sets. The link between aggregated-bases extracts within ArkeoGIS allowed us to set up a cross-requesting and test possibilities in a prototype developed by the consortium IndexMed. This prototype, open source, allows the establishment of links between objects from different databases. The consortium IndexMed aims to identify and to raise the scientific challenges related to data quality and heterogeneity. The use of graphs allows us to consider data despite their disparity and without prioritization, and improve decision support using emerging data mining methods (collaborative clustering, machine learning, graphs approaches, representation knowledge). Adapting these methods in archeology allows us to go beyond the "simple" data aggregation: ArkeoGIS can therefore also be used to power such tools allowing us to mine our data and metadata.

Un point commun des études en archéologie, en écologie ou sur les systèmes sociaux est que la production de données est à la fois coûteuse et peu automatisée. Les suivis de longues séries temporelles et/ou à larges emprises spatiales sont difficiles à mener, dès lors qu’il faut recourir sur une longue durée à plusieurs observateurs. La robustesse et la reproductibilité de l’observation sont aussi plus difficiles à obtenir, voire impossibles en archéologie, même si les méthodes de modélisation se développent. Dans un cadre de production de données multi-sources, l’équivalence des systèmes d’observations et l’inter-calibration d’observateurs deviennent cruciales. Des approches intégratives, pluri- ou trans- disciplinaires, deviennent nécessaires à l’étude de systèmes où la production de données dans chaque discipline est discontinue, plus ou moins précise et mal répartie. Pourtant, toutes les variables (caractérisation des activités économiques, des installations humaines, études des productions, objets reconstitués ou découverts, données biotiques et abiotiques, cartographies des pressions anthropiques et naturelles, services rendus et ressentis, image sociétale...) de ces systèmes interagissent dans le temps et à chaque échelle spatiale. Après quelques années d’existence, ArkeoGIS agrège aujourd’hui 67 bases de données représentant plus de 50 000 objets (sites, analyses...). Fort de cette normalisation de l’information archéologique et paléo-environnementale, il nous a semblé important de tester de nouvelles méthodes de fouille de données, afin de mettre en évidence de possibles données « connexes » et complexes possiblement reliables à ces jeux de données. Le lien entre les extraits des bases agrégées au sein d’ArkeoGIS nous a permis de tester ces approches grâce à un prototype “open source” développé par le consortium IndexMed. Ce prototype permet la mise en place de liens entre objets de bases de données différentes. Le consortium IndexMed a pour objectif d’identifier puis de lever les verrous scientifiques liés à la qualité des données et à leur hétérogénéité. La représentation de l’information sous forme de graphe rend possible la prise en compte des données malgré leur disparité et sans les hiérarchiser, et permet d’améliorer la précision des outils d’aide à la décision utilisant des méthodes émergentes d’analyse de données (clustering collaboratif, classification collective, fouille de graphes, analyse de réseau, extraction de communautés). Adapter ces méthodes à l’archéologie nous permet d’aller audelà de la « simple » agrégation de données : ArkeoGIS peut donc aussi servir à alimenter les outils de fouille utilisés au sein de nos données et métadonnées.

visualisation data qualification graph distributed information system archeology

visualisation qualification de données graphes système d’information décentralisé archéologie