Problématique : De la nécessité d'outils d'analyse généalogique et philologique

Philologie

La philologie est l'art d'établir les textes par l'analyse de leur contenu, de leur identité et de leur histoire, étant donné plusieurs sources, afin d'en fixer des versions de référence authentifiées.

La transposition de cette discipline dans notre contexte du document numérique rééditorialisé consisterait à pouvoir identifier, comparer et critiquer des fragments documentaires afin de décider de leur pertinence pour un contexte éditorial donné : création de nouveaux documents à partir de fragments existants et évolution de fragments au sein d'un document existant typiquement.

Généalogie

La généalogie est l'étude des filiations entre individus par l'analyse des données qui les caractérisent (noms, documents d'identité...). Transposée à notre contexte il s'agirait de pouvoir conserver et/ou reconstruire les liens historiques entre fragments afin d'aider à percevoir leurs évolutions, et les contextes qui les ont sous-tendu, toujours pour aider à décider de leur pertinence étant donné un contexte éditorial.

Philologie et généalogie se croisent, a fortiori si l'on considère la généalogie génétique qui cherche à exploiter les ressemblances entre caractères intrinsèques de l'individu : l'ADN dans le cas de l'être humain, le contenu documentaire dans notre contexte.

Enjeu du travail

Considérant la complexité du processus éditorial dans un système de gestion de fragments documentaires vivants, l'idée de la thèse est d'élaborer des outils d'inspiration philologique et généalogique permettant d'aider à gérer cette complexité.

Dans un système fortement orienté réutilisation, les risques sont que les utilisateurs transfèrent leur temps d'écriture en temps de gestion ; qu'ils renoncent à exploiter les propriétés de rééditorialisation du système (voire le système lui-même) devant l'overhead de gestion induit, les risques d'erreur (gestion de la complexité) et la perte de contrôle ou de confiance (altération de la maîtrise documentaire). Le système doit donc supporter ses utilisateurs afin que la rééditorialisation soit la moins adhérente possible au processus d'écriture.

Par exemple l'évolution d'un fragment réutilisé au sein de nombreux documents peut demander aux auteurs/gestionnaires de ces documents de prendre une décision : conserver le fragment d'origine ou adopter la nouvelle version. Cette décision dépend :

  • de la nature de la modification : syntaxe sans conséquence sur le sens (orthographe), réduction ou augmentation du contenu sans altération du contenu existant préalablement, modification du sens et de l'existant...

  • de la nature de l'intégration du fragment dans chaque document, la place qu'il occupe et le rôle qu'il joue dans le document.

  • des processus éditoriaux : document publié, en cours d'écriture, de réédition, dynamiquement publié à chaque modification...

L'objectif est de n'interroger les utilisateurs que sur ce qui est nécessaire en leur donnant la juste information dont ils ont besoin pour prendre leur décision.

Pistes de travail

Les pistes à considérer seront typiquement :

  • Un modèle de métadonnées documentaires au niveau fragments (description), inter-fragments (relations) et intra-fragment (contenu) :

    • l'identification des fragments permettant de les individualiser de façon universelle

    • la description des fragments à l'aide de jeux de métadonnées reflétant leur contextes éditoriaux de création et d'évolution

    • l'association des fragments selon des relations historiques (a été créé/modifié le), géographiques (a été créé/modifié dans tel système), généalogiques (est issu de la copie/modification/dérivation de, est une nouvelle version de...), structurelles (est fils de, est père de, est frère/co-occurrent de...), de ressemblance (possède un contenu syntaxiquement proche de, possède un fragment en commun avec, est une transformation de...)...

  • Des processus d'établissement de ces métadonnées par le système (automatique) et par les utilisateurs (manuel et semi-automatique) :

    • l'intégration aux systèmes de capacités d'enregistrement automatique des métadonnées et associations tout au long des processus éditoriaux

    • l'intégration aux systèmes de fonctions pour l'annotation critique des fragments (fonction philologique) et l'expression de relations reconstruites (fonction généalogique) : notes de révision, expression de comparaisons, expression d'alternatives (selon telle ou telle intentionnalité éditoriale), analyse différentielle...

  • Des outils d'appréhension et d'exploitation de ces métadonnées :

    • la présentation aux utilisateurs de l'information juste nécessaire ;

    • avec des modalités de lecture adaptées à la consultation efficace de ces informations.

L'enjeu de la thèse est de parvenir à un système aidant l'utilisateur à prendre la meilleure décision avec un minimum de travail humain.