Approche
État de l'art
Le travail de thèse s'attachera en premier lieu à établir un état de l'art approfondit notamment dans les domaines :
du diff & merge XML, domaine largement étudié par ailleurs (cf état de l'art du projet C2M). Cette étude s'inscrira dans la continuité du travail de master de Vu (2011). L'objectif sera d'une part d'identifier les outils et algorithmes existants et pouvant être réutilisés ; et d'autre part de montrer en quoi l'originalité de l'approche (documents structurés et fragmentés) influe sur cet existant ;
des outils documentaires en général (et de l'Enterprise Content Management (ECM) en particulier) afin d'étudier comment cette problématique est étudiée par ailleurs, d'identifier des jeux de métadonnées standards...
des IHM de manipulation documentaire : visualisation documentaire complexe, visualisation différentielle, visualisation de graphes...
L'état de l'art pourra également être complété par une étude des domaines de la philologie et de la généalogie afin de prolonger la métaphore fondatrice du sujet et s'inspirer au mieux de ces disciplines.
Bien entendu la bonne appréhension par le doctorant du contexte théorique de l’ingénierie documentaire (cf. Pédauque, Bachimont, Crozat...) sera un préalable indispensable.
Contributions potentielles
Les pistes de contribution seront typiquement :
A priori (en amont ou pendant le processus d'écriture) :
Des modèles de métadonnées à enregistrer (historisation)
...
A posteriori (en aval du processus d'écriture) :
Des algorithmes de comparaison adaptés au contexte des documents structurés et fragmentés (cf. état de l'art du projet C2M)
Des algorithmes de fusion automatique correspondant à des cas décidables (idem)
Des algorithmes de préparation à des opérations de fusion interactive correspondant à des cas non décidables (cf Master de Vu)
Des IHM pour la fusion interactive, incluant des approches spatiales (co-visualisation des différences, principe du graph) et temporelles (visualisation des évolutions dans le temps, principe du replay)
Des approches heuristiques permettant de reconstruire automatiquement ou semi-automatiquement les métadonnées manquantes (qui n'ont pas pu être enregistrées lors du processus de création, celui-ci s'étant déroulé dans un système ne permettant pas cet enregistrement).
Des outils d'annotation critiques et philologiques (en lien avec la thèse de Thibaut Arribe sur le travail collaboratif et l'annotation)
L'on explorera notamment les pistes originales suivantes :
La nature documentaire de l'objet : il ne s'agit pas seulement d'un fichier XML, mais d'un document qui en tant que tel a des propriétés particulières.
La nature fragmentée de l'objet : il s'agit d'un document représentable selon un graphe de fragments.
L'exploitation du modèle Scenari (abstraction documentaire réalisée au sein de SCENARIbuilder) pour l'enrichissement et le contrôle des opérations : il ne s'agit pas seulement d'un document, mais d'un document sur lequel on possède des informations a priori.
L'on étudiera notamment les cas d'usage suivants :
Travail personnel (un seul auteur)
Travail collaboratif contrôlé (plusieurs auteurs au sein d'un seul système)
Travail collaboratif étendu (plusieurs auteurs au sein de plusieurs systèmes déconnectés avec import/export de contenu)
La paramétrabilité
Le travail s'inscrira également dans le contexte de la paramétrabilité de Scenari (cf. travaux en cours de Thibaut Arribe) : les contributions seront pensées et conçues comme des outils génériques configurables au contexte d'usage.