Problématique

S'il est possible de créer des chaînes éditoriales XML ad hoc sans Scenari, cela demande l'intégration de technologies plurielles et de la programmation informatique. Scenari est un environnement unique au monde, grâce à son module SCENARIbuilder qui permet de concevoir des modèles de document dans un langage de haut niveau et de les instrumenter dans SCENARIchain, sans programmation. SCENARIbuilder propose en effet une couche de primitives qui permet la modélisation déclarative de modèles structurels et comportementaux de documents multimédia et interactifs.

Si l'on se permet une analogie avec le domaine des bases de données, Scenari est l'équivalent d'un Système de Gestion de Bases de Données (SGBD, comme Oracle par exemple), c'est à dire un environnement de haut niveau permettant l'instanciation de base de données, grâce à un langage déclaratif (SQL dans le cas des bases de données). On parle alors de SGCE : Système de Gestion de Chaînes Éditoriales.

Le projet MCD-CE cherche à pousser l'analogie à un niveau conceptuel supérieur en comblant une lacune dans le domaine de l'ingénierie documentaire : tandis que le domaine des bases de données dispose de méthodologie de modélisation conceptuelle - comme Merise en son temps, ou aujourd'hui UML - le domaine documentaire ne dispose pas de cette couche d'abstraction. En bases de données le schéma de conception préconise de formaliser le système sous la forme d'un Modèle Conceptuel de Données (MCD), grâce à une représentation Entité-Association ou un diagramme de classe UML, puis de traduire cette représentation dans un Modèle Logique de Données (MLD), typiquement le formalisme relationnel en bases de données.

Dans le domaine de l'ingénierie documentaire la conception d'une chaîne éditoriale se positionne d'emblée au niveau logique, aujourd'hui supporté par XML.

Premier axe : Niveau conceptuel (MCDoc)

La première question que nous souhaitons traiter est celle de la mise au point d'un formalisme de type MCDoc (Modèle Conceptuel de Document) adapté à la conception de chaînes éditoriales.

Les résultats seront formalisés sous la forme d'une méthode, et mis en œuvre dans un atelier de conception permettant une modélisation basée sur UML, la traduction dans les formalismes XML traditionnels (schéma typiquement) et dans le système Scenari.

L'enjeu est d'une part d'exploiter au mieux UML pour ce qu'il permet de faire de façon générique, et de l'étendre au besoin pour s'adapter au contexte particulier du documentaire : stéréotypes, design patterns, contraintes d'ordre grammaticales...

Second axe : Niveau logique (MLDoc)

Une seconde question, intimement liée à la première se pose également, à condition de prolonger encore notre analogie. Le domaine des bases de données a également permis de faire émerger des concepts complémentaires au paradigme fondateur (le tableau), que l'on retrouve par exemple dans les modèles relationnel-objet (comme par exemple l'héritage, l'encapsulation, ...).

L'enjeu serait pour le document de penser, au delà du modèle de l'arbre et des relations méréologiques qui le sous-tendent, des structures logiques nouvelles propres à faire évoluer le concept même de document numérique. On citera par exemple des mécaniques existantes, embryonnaires ou envisagées dans Scenari et identifiées dans Precip : la fragmentation-agrégation permet de définir un document par recomposition de fragments d'autres document (passage du modèle d'arbre au modèle de réseau) ; la dérivation-surcharge permet de définir un contenu par différentiel avec un autre contenu : contenu2=contenu1 avec les différences di ; le contenu à profondeur variable permet de poser qu'un contenu dit la même chose qu'un autre contenu, mais avec un niveau de détail inférieur ou supérieur...

Une difficulté sera de traduire ces formes non fondamentalement arborescentes au sein des technologies classiques du domaine (schémas XML typiquement) et dans Scenari.