Verrou principal : Fragmentation et ré-éditorialisation

Le modèle dominant mobilisé pour représenter un document numérique est de type : « 1 document = 1 fichier ».

Les systèmes de GED - ou ECM - s'appuient massivement sur ce principe. L'unité de gestion - le document - correspond au fichier, souvent un PDF ou un document bureautique éditable (Word, OpenOffice, etc), associé à des méta-données descriptives.

L'exception la plus notable à ce modèle concerne les documents multimédia à langages de balises (HTML, SMIL, etc.), pour lesquels les ressources (images, sons, vidéo, etc.) sont externalisées pour cause de contraintes techniques et pour lesquels des liens ou inclusions peuvent exister afin de fragmenter intentionnellement le document en plusieurs fichiers, souvent à des fins de facilité de navigation, de gestion ou d'amélioration des performances.

Les chaînes éditoriales XML consacrent ce principe de fragmentation en en faisant la règle : « 1 document = N fragments » (un document en général une agrégation de plusieurs fragments).

En effet, une des finalités principales de la chaîne éditoriale est la rééditorialisation, ce qui implique qu'un même ensemble de fragments se recombinent et se réagencent en fonction de finalités éditoriales proches mais distinctes (variation de support, de public, d'usage, etc.).

La forme lisible d'un document numérique est toujours obtenue par une reconstruction, par le calcul d'une forme abstraite numérique. La chaîne éditoriale pousse donc la logique de ce principe en annulant l'identité entre fichier et document, afin de permettre une manipulation plus puissante du document.

Si les chaînes éditoriales montrent leur puissance en termes de production et de publication, elles ne trouvent pas aujourd'hui leur équivalent dans les systèmes de gestion documentaire. En effet les systèmes d'ECM proposent des mécanismes de gestion performants et avérés (suivi de versions, gestions de droits, cycle de vie, workflow, etc.), mais uniquement dans le cas « 1 document = 1 fichier ».

L'abstraction qui consiste à considérer le document comme une reconstruction dynamique à partir de fragments reste un problème difficile pour ces systèmes aujourd'hui.

Les enjeux documentaires émergents plébiscitent les principes de rééditorialisation qui impliquent à la fois l'usage de chaînes éditoriales (pour la production et la recombinaison, la publication) et des ECM (pour la gestion).

L'objectif du projet est de penser et de réaliser les développements permettant à ces deux « mondes » de s'intégrer pour devenir une solution type globale pour la production et la rééditorialisation de contenus.

La question principale qui est posée est celle de la généalogie documentaire, ou comment gérer et exploiter les liens logiques et historiques entre les fragments ?

La complexité naît alors de deux axes orthogonaux :

  • dans une logique collaborative, chaque fragment peut être modifié par plusieurs auteurs (complexité habituellement gérée par des mécaniques de gestion que connaissent les systèmes d'ECM : check-in/check-out, versionning, historisation, etc.) ;

  • mais chaque document est également impacté par la modification de chacun de ses fragments. La rupture de l'identité fichier-document introduit une complexité nouvelle qui entre en résonance avec la première.

Chaque modification appelle donc des décisions délicates : répercussion des modifications sur quelles catégories d'utilisateurs (auteurs, lecteurs, relecteurs, co-auteurs, etc.) ? Sur quels documents (version avancée, version simplifiée, version papier, version écran, version de relecture, version officielle, version adaptée, etc.) ? Etc.

La question est alors de savoir quelles décisions prendre automatiquement et/ou comment aider les utilisateurs à les prendre, sachant que l'expérience des systèmes d'ECM montre que la gestion des conflits issus du travail collaboratif est particulièrement difficile pour les utilisateurs.