Objectifs

Contexte général

Le projet MCD-CE s'inscrit dans le contexte du système de conception de chaînes éditoriales Scenari d'une part et dans la continuité et la complémentarité des projets ANR CONTINT C2M et CR Picardie PRECIP d'autre part (projets qui se terminent en 2012).

Scenari est un logiciel FLOSS (Free/Libre and Open Source Software) permettant la conception de chaînes éditoriales XML. Une chaîne éditoriale XML est un procédé informatique permettant la production et la publication de documents structurés ayant deux propriétés fondamentales :

  • Le polymorphisme : le format de production du contenu (le fond) est dissocié du format de publication (la forme), et le contenu peut ainsi être présenté selon plusieurs formes selon le support visé typiquement (papier, écran, diaporama, smartphone, ...)

  • La rééditorialisation (repurposing) : les contenus sont dissociés des scénarios documentaires qui les matérialisent, pour exister sous la forme de réseau de fragments invoqués au sein de plusieurs documents, le même fragment documentaire peut ainsi servir plusieurs intentions éditoriales différentes

Le projet C2M travaille sur l'extension de ces concepts - séparation fond/forme et fragmentation - dans un contexte d'écriture collaborative.

Le projet PRECIP travaille notamment sur une théorisation de l'écriture numérique, permettant de relever ses fonctions fondamentales (ce que l'écriture numérique permet de faire) et des figures typiques (sous quelles formes l'écriture numérique peut s'exprimer).

Problématique

S'il est possible de créer des chaînes éditoriales ad hoc sans Scenari, cela demande l'intégration de technologies plurielles et de la programmation informatique.

Scenari est un environnement unique au monde, grâce à son module SCENARIbuilder qui permet de concevoir des modèles de document dans un langage de haut niveau et de les instrumenter dans SCENARIchain, sans programmation. SCENARIbuilder propose en effet une couche de primitives qui permet la modélisation déclarative de modèles structurels et comportementaux de documents multimédia et interactifs.

Si l'on se permet une analogie avec le domaine des bases de données, Scenari est l'équivalent d'un Système de Gestion de Bases de Données (SGBD, comme Oracle par exemple), c'est à dire un environnement de haut niveau permettant l'instanciation de base de données, grâce à un langage déclaratif (SQL dans le cas des bases de données). On parle alors de SGCE : Système de Gestion de Chaînes Éditoriales.

Le projet MCD-CE cherche à pousser l'analogie à un niveau conceptuel supérieur en comblant une lacune dans le domaine de l'ingénierie documentaire : tandis que le domaine des bases de données dispose de méthodologie de modélisation conceptuelle - comme Merise en son temps, ou aujourd'hui UML - le domaine documentaire ne dispose pas de cette couche d'abstraction. En bases de données le schéma de conception préconise de formaliser le système sous la forme d'un Modèle Conceptuel de Données (MCD), grâce à une représentation Entité-Association ou un diagramme de classe UML, puis de traduire cette représentation dans un Modèle Logique de Données (MLD), typiquement le formalisme relationnel en bases de données.

Dans le domaine de l'ingénierie documentaire la conception d'une chaîne éditoriale se positionne d'emblée au niveau logique, aujourd'hui supporté par XML.

À noter également que dans le domaine des bases de données il existe des ateliers de conception qui assistent le concepteur dans sa démarche (Rational Rose par exemple).

La couche d'abstraction proposée par le MCD est dotée de nombreuses vertus, que nous ne démontrerons pas ici : meilleure appréhension du problème au niveau conceptuel qu'à un niveau logique, possibilité de faire dialoguer les acteurs techniques et fonctionnels, aide à l'entrée dans le domaine par de nouveaux acteurs (démultiplication), découpage de problèmes complexes, ...

Analogie bases de données - chaînes éditoriales
Analogie bases de données - chaînes éditoriales

Première question de recherche : Modélisation conceptuelle et atelier de conception

La première question que nous souhaitons traiter est celle de la mise au point d'un formalisme de type MCDoc (Modèle Conceptuel de Document) adapté à la conception de chaînes éditoriales.

Les résultats seront formalisés sous la forme d'une méthode, et mis en œuvre dans un atelier de conception permettant une modélisation basée sur UML, la traduction dans les formalismes XML traditionnels (schéma typiquement) et dans le système Scenari.

L'enjeu est d'une part d'exploiter au mieux UML pour ce qu'il permet de faire de façon générique, et de l'étendre au besoin pour s'adapter au contexte particulier du documentaire : stéréotypes, design patterns, contraintes d'ordre grammaticales, ...

À noter que les concepteurs de XML Schemas se sont livrés en partie à cet exercice, mais au niveau logique uniquement, et ont obtenu des premiers résultats encourageants.

La question concerne d'abord le document dans sa forme statique (le contenu tel qu'il est inscrit à un instant), mais également dans son processus d'écriture (les actes qui encadrent et mènent l'inscription), processus potentiellement collaboratif (tel qu'il est étudié dans le cadre du projet C2M).

Seconde question de recherche : Formes documentaires

Une seconde question, intimement liée à la première se pose également, à condition de prolonger encore notre analogie. Le domaine des bases de données a également permis de faire émerger des concepts complémentaires au paradigme fondateur (le tableau), que l'on retrouve par exemple dans les modèles relationnel-objet (comme par exemple l'héritage, l'encapsulation, ...).

L'enjeu serait pour le document de penser, au delà du modèle de l'arbre et des relations méréologiques qui le sous-tendent, des structures logiques nouvelles propres à faire évoluer le concept même de document numérique.

On citera par exemple des mécaniques existantes, embryonnaires ou envisagées dans Scenari et identifiées dans Precip :

  • la fragmentation-agrégation permet de définir un document par recomposition de fragments d'autres document (passage du modèle d'arbre au modèle de réseau)

  • la dérivation-surcharge permet de définir un contenu par différentiel avec un autre contenu : contenu2=contenu1 avec les différences di.

  • le contenu à profondeur variable permet de poser qu'un contenu dit la même chose qu'un autre contenu, mais avec un niveau de détail inférieur ou supérieur

  • ...

Ces formes documentaires rendues possibles par le numérique, ou mises en exergue par son instrumentation, conduisent à de nouvelles expressions au niveau logique (l'arbre comme représentation du document ne suffit pas) et par conséquent ouvrent de nouvelles possibilités d'expression au niveau conceptuel. En particulier l'enjeu est de dégager des formes récurrentes sous la forme de design patterns (prototypes de modélisation récurrents répondant de façon correcte à une classe de problème identifiée).

Afin de dégager et de définir ces formes, l'idée est d'interroger l'écriture numérique et les formats documentaires comme cela a été initié dans le projet PRECIP, afin d'en dégager des fonctions et des formes rhétoriques typiques. Une autre idée à étudier est d'interroger les concepts classiquement mobilisés dans le domaine des langages informatiques (héritage, facettes, interfaces, déclinaisons, surcharge, librairies, ...) et de chercher lesquels pourraient être mobilisés au niveau de l'expression documentaire.

Une difficulté sera de chercher à traduire ces formes non fondamentalement arborescentes au sein des technologies classiques du domaine (schémas XML typiquement) et dans Scenari. Ces travaux déboucheront donc également certainement sur des propositions d'évolution pour les formalismes de schémas et pour les primitives de Scenari, à un niveau logique que nous nommerons MLDoc.