exit

Information et communication   > Accueil   > Revue ouverte d’ingénierie des systèmes d’information   > Numéro

Vol 2 - Numéro 1

Revue ouverte d’ingénierie des systèmes d’information


Articles parus

Préface

Ce numéro spécial de la revue Open ISI regroupe des extensions d’articles des deux dernières éditions d’INFORSID. Il n’est pas seulement consacré au “meilleur” d’INFORSID 2019 et 2020, mais représente aussi la diversité de notre domaine. Il contient en effet une sélection d’articles que nous avons choisis pour leur qualité mais aussi pour le recul qu’ils offrent sur la recherche en SI.


Ce que le numérique fait à l’archéologie et aux archéologues. Un retour d’expériences et un projet de recherche en cours.

L’article présente le travail en cours d’une thèse d’histoire à CY Cergy Paris Université, en partenariat avec l’Institut National du Patrimoine. Le déploiement en cours et de plus en plus rapide de dispositifs numériques en archéologie demeure faiblement interrogé, en particulier pour les activités de recherche dans cette discipline. Si les nouveaux moyens et les nouvelles pratiques numériques tentent de se rendre accessibles au plus grand nombre, elles laissent aussi de côté une partie des archéologues et révèlent des risques de fracture des collectifs de travail. Depuis une participation observante, l’auteur propose un travail réflexif pour une recherche épistémologique, d’histoire des sciences et techniques et de sociologie des organisations professionnelles de l’archéologie. Les effets étudiés concernent l’archéologie comme discipline et les archéologues comme ensemble de compétences individuelles, de pratiques collectives et d’identités professionnelles. Les matériaux d’étude sont constitués par de nombreuses observations et retours d‘expérience depuis plus de dix ans dans le domaine de l’acquisition des données archéologiques de terrain, au sein de l’Institut national de recherches archéologiques préventives (Inrap), et dans plusieurs projets collectifs de recherche pluridisciplinaires.


Du tracking, des contre-mesures et de leur efficacité dans la publicité ciblée

D’un Web de documents à l’intérêt commercial incertain, porté par des pionniers croyant au partage des connaissances, le Web a par la suite évolué vers une forme collaborative et temps réel rentabilisée par la publicité. Cette dernière a évolué vers la publicité ciblée incluant la publicité comportementale basée sur la collecte massive de traces d’usage. Ces traces proviennent de différents dispositifs de tracking incluant les adresses IP (IP tracking), les désormais connus cookies ou les empreintes (p. ex. browser fingerprinting et canvas fingerprinting). Si la collecte s’est au départ limitée au poste de travail (essentiellement au travers du navigateur), elle a pu par la suite s’étendre aux smartphones et objets connectés. En a découlé le marketing des traces et l’économie de l’attention auxquels les digital natives ont été précocement confrontés. Diverses contres-mesures ont été progressivement déployées par les utilisateurs (paramétrage, extensions, p. ex. bloqueurs de publicités), par des services d’anonymisation (p. ex. VPN et proxy), par les éditeurs eux-mêmes ou par le régulateur (p. ex. RGPD). Ce papier propose, d’une part, une présentation de la structuration du secteur de la publicité en ligne suivie par un état de l’art sur les outils de tracking qui y sont déployés, d’autre part, un inventaire et une analyse des contre-mesures déployées ainsi que de leur efficacité. Nous montrons en particulier l’évolution rapide des techniques utilisées et l’hétérogénéité de la couverture offerte par des dispositifs protecteurs a priori équivalents.


BLADE : Un outil d’aide à la décision automatique pour guider le choix de technologie Blockchain

Les entreprises souhaitant déployer des solutions basées sur la blockchain sont confrontées à une pléthore de technologies concurrentes ayant chacun un grand nombre de paramètres propres devant être ajustés par un expert. Les études existantes proposant des modèles de décision pour blockchain ne proposent pas de solution pour le choix des paramètres assurant la mise en oeuvre automatique des exigences non-fonctionnelles. Cet article, version étendue de précédents travaux, présente BLADE (BLockchain Automated DEcision Engine), un outil d’aide à la décision pour blockchain permettant de mieux prendre en compte les exigences de haut niveau et préférences. Tout d’abord, une base de connaissances de solutions blockchain est construite à partir de documentations, de livres blancs et de travaux de recherche académiques. Celle-ci permet à BLADE d’exécuter un processus de décision multicritère automatisé donnant la solution la plus pertinente à partir d’exigences et préférences, extraites de la norme de qualité logicielle ISO 25010. L’implémentation de cet outil est ensuite réalisée au sein d’une plateforme web permettant la saisie aisée des exigences et des préférences de l’utilisateur. Enfin, l’approche proposée est validée grâce à un cas d’étude de gestion de chaîne logistique. Cette étude est une première étape afin de concevoir une solution permettant la conception et l’implémentation d’applications blockchain de bout-en-bout.


RFreeStem : Une méthode de racinisation indépendante de la langue et sans règle

La racinisation est un pré-traitement essentiel dans de nombreuses tâches de fouille de texte. Les algorithmes les plus utilisés sont basés sur l’application successive de règles spécifiques à la langue. Cette construction les rend fortement dépendants de la langue d’application. Par opposition, les raciniseurs basés sur des corpus présentent souvent une importante complexité algorithmique, les rendant peu efficaces. Ils ne mettent pas non plus nécessairement à disposition les racines extraites, pourtant requises pour certaines tâches de traitement de texte. Nous proposons ici une nouvelle approche, appelée RFreeStem, qui se base sur l’étude d’un corpus et peut être appliquée à différentes langues. L’implémentation de notre méthode est flexible et efficace, car basée sur un unique parcours des n-grammes. Nous détaillons également une méthode d’extraction des racines. Nos expériences montrent que RFreeStem améliore les résultats des tâches de traitement de texte, plus encore que la référence de l’état de l’art, Porter, tout en proposant une racinisation sur des langues peu dotées, où aucune version de Porter n’est implémentée.


Évolution et formalisation de la Lambda Architecture pour des analyses à hautes performances - Application aux données de Twitter

Extraire de la valeur des données des réseaux sociaux est une tâche complexe induite par leur vélocité, volume et variabilité. Les utilisateurs s’approprient le dispositif et développent des usages multiples, ce qui renforce la variabilité sémantique. Les résultats des analyses doivent être produits au plus tôt (de manière optimale en temps réel) pour en renforcer la pertinence. Pour y parvenir, des connaissances métiers sont essentielles et elle sont généralement acquises lors d’analyses exploratoires. En conséquence, les plateformes de collecte, stockage et analyse des données des réseaux sociaux doivent supporter des flux de données importants, des analyses en temps réel et des analyses exploratoires. Des styles et des patrons d’architecture permettent de prendre en compte ces spécificités, afin de proposer des techniques de prise en charge de ces données, et ainsi de faciliter leur traitement. Ces architectures ont besoin d’être formalisées, pour étudier de quelle manière les propriétés essentielles sont respectées, connaître leur comportement, et anticiper les effets que peuvent avoir les composants lorsqu’ils sont regroupés au sein d’une même architecture, et ce avant même de les développer puis de les mettre en production. Dans cet article, nous proposons un patron d’architecture, la Lambda+ Architecture, inspiré de la Lambda Architecture et adapté au traitement des données massives. Nous proposons également un cadre formel pour la spécification d’architectures se basant sur la théorie des catégories, ainsi qu’une implémentation de notre patron pour analyser les données issues de Twitter.


Autres numéros :

2020

Volume 20- 1

Numéro 1
Numéro 2
Numéro 3
Numéro 4

2021

Volume 21- 2

Numéro 1