Contexte : Le numérique et l'industrialisation de la rééditorialisation

La seconde révolution documentaire

Le document numérique ouvre sur une seconde révolution documentaire. La première révolution (Pedauque, 2006) est issue de la révolution scientifique, puis technique, et la prolifération documentaire qui l'a accompagnée (Briet, 1951). À cette phase de «documentarisation» succède une phase de «redocumentarisation», issue du numérique : «L'activité documentaire a accompagné et stimulé la modernisation des sociétés industrielles [...] les multiples développements du numérique documentaire illustrent et favorisent l'émergence hésitante d'une nouvelle modernité, par un processus de « redocumentarisation. (Pedauque, 2006)»

La seconde révolution conduit à la rééditorialisation

L'inscription numérique ne conduit pas uniquement à un changement de support, c'est une révolution cognitive. Goody (1979) avait mis en évidence l'émergence d'une «raison graphique» lors du passage de l'oral à l'écrit, issue de la spatialisation de l'information. Bachimont (2004) pose que le passage au numérique est un changement du même ordre qui conduit à la naissance d'une «raison computationnelle», issue des propriétés calculatoire de l'ordinateur.

Le numérique ouvre un champ du possible nouveau en terme de modalités d'écriture, en lien avec ses propriétés fondamentales : la discrétisation de l'information en unité manipulables automatiquement. L'écriture numérique s'en trouve profondément modifiée, suivant des «tropismes» tels que : la manipulabilité, l'abstraction, l'adressabilité, l'universalité, la clonabilité... (Crozat et al., 2011).

Une manifestation particulièrement notable de cette transformation peut être décrite sous le terme de rééditorialisation

La rééditorialisation

Le terme rééditorialisation est un néologisme qui a émergé dans le domaine du document numérique pour désigner le processus consistant à reconstruire un nouveau document à partir d'archives. La construction de ce mot tente une première synthèse entre les concepts d'édition au sens de publication d'une œuvre, d'éditorialisation au sens d'expression d'un point de vue propre, de rééditer au sens de redonner à lire. Elle tente une seconde synthèse entre les fonctions d'éditeur, celui qui met en forme et diffuse, et d'auteur, celui qui écrit, qui tendent à se mêler dans le contexte du numérique. La rééditorialisation est donc la publication d'une œuvre originale dans son point de vue, sa forme, sa scénarisation, à partir de contenus qui ne le sont pas tous.

Rééditorialisation est la traduction admise du terme anglais repurposing, "donner un nouvel objectif", que l'on pourrait traduire par "réobjectivation", au sens commun de redonner un objectif, et au sens de Bachimont (2007:166) de poser une marque auctoriale objective à laquelle va se confronter l'appropriation par le lecteur. Le Grand Dictionnaire Terminologique (Québec, http://www.granddictionnaire.com) traduit repurposing par "réorientation des données" et le définit comme la "réutilisation des données dans une autre application ou sur un support différent". On pourrait parler de "réorientation documentaire" pour spécialiser cette définition dans notre contexte, ou de "réobjectivation documentaire".

Processus de rééditorialisation

Un processus de rééditorialisation mobilise en général plusieurs étapes, dont essentiellement :

  1. une sélection des archives : recherche et sélection de documents ou extraits de documents à propos

  2. une déconstruction de ces archives : découpage et sélection des fragments pertinents pour le nouvel objectif de communication ;

  3. une transformation (optionnelle) de ces fragments : réécriture de parties de ces fragments

  4. une production originale : ajout de fragments spécifiques au nouveau contexte ;

  5. une reconstruction documentaire (ou scénarisation) : ordonnancement des fragments et articulation (introduction, transitions, conclusion, ...) ;

  6. une publication : homogénéisation de l'ensemble dans une mise en forme unifiée et adaptée au nouveau contexte, ajout des métadonnées de publication (date, auteur, ...).

Rééditorialisation et chaînes éditoriales collaboratives

La rééditorialisation est un processus de construction de neuf avec de l'ancien, qui est à l'origine de plus ou moins tous les processus d'écriture. Elle ne naît pas du numérique, mais en l'instrumentant il la généralise et ce qui était marginal dans le processus traditionnel devient dominant. L'écriture numérique devient fondamentalement rééditorialisation, un exemple prégnant dans nos pratiques étant l'usage massif du copier/coller.

Au sein des chaînes éditoriales XML collaboratives (cf. projet C2M : http://www.utc.fr/ics/c2m), comme Scenari (Crozat, 2007), la rééditorialisation se manifeste via plusieurs modalités d'écriture originales par rapport aux pratiques dominantes :

  • Le polymorphisme

    Un même contenu pour plusieurs supports : Web, papier, diaporama, smartphone...

  • La fragmentation-agrégation

    Un même morceau de contenu est utilisé dans plusieurs contextes : qualité, formation, documentation technique...

  • La dérivation-surcharge

    Un même contenu est mobilisé selon plusieurs variations : standards, langues...

  • ...

Ces traitements sont originaux dans la mesure où les autres systèmes éditoriaux - traitements de texte, éditeurs HTML et Web CMS (Content Management System), Wikis, éditeurs multimédia (Flash, SMIL...)... - restent majoritairement sur un paradigme du WYSIWYG (What You See Is What You Get) qui mêle contenu et structure du document à une mise en forme donnée, "en dur", qui interdit ou complique la manipulation en vue de la reconstruction automatisée. Les chaînes éditoriales XML, a contrario, s'inscrivent dans le paradigme du document structuré (André et al., 1989) qui ouvre un potentiel manipulatoire, et conséquemment fonctionnel, plus grand..

Ces fonctions font des chaînes éditoriales XML des solutions particulièrement pertinentes pour instrumenter la rééditorialisation, qui les placent en marge des autres systèmes du point de vue de la production et de la maintenance de l'information (on notera que les systèmes d'édition LaTeX - LyX par exemple - ou SGML - Framemaker par exemple - se fondent sur des principes similaires).

Complexification des processus d'écriture et notion de contrôle

L'intégration de telles fonctions d'écriture dans le processus a comme conséquence une abstraction et une complexification du processus d'écriture. L'enjeu d'un système d'écriture de type chaîne éditoriale XML est d'ouvrir le potentiel de ses fonctions, tout en maintenant pour l'auteur une exigence cognitive compatible avec un processus d'écriture (en l'altérant - nécessairement - mais sans l'oblitérer).

La gestion de cette dualité, augmenter et modifier les fonctions tout en conservant des pratiques compatibles avec l'écriture, passe par le contrôle via la modélisation, au sens où le système est capable de gérer la complexité qu'il engendre.

Cette gestion s'exerce en amont du processus, pour l'adapter à celui-ci, on parlera de spécialisation du système au contexte, via sa paramétrabilité (cf. thèse en cours de Thibaut Arribe) ; et au cours du processus pour accompagner l'acte d'écriture. L'enjeu est alors essentiellement informatif et ergonomique : donner aux auteurs la juste information dont ils ont besoin, pour réduire leur charge cognitive et mener au mieux leur activité dans un environnement complexe ; et ainsi leur permettre de réaliser leurs actions le plus efficacement possible pour ne pas perturber le processus d’écriture en lui même.

Rééditorialisation en contexte collaboratif et dimension philologique

Un des problèmes les plus exacerbés de la complexité induite par la rééditorialisation, en général, est d'ordre philologique (au sens de l'établissement des texte) : Comment décider de la pertinence, de la validité, de l'authenticité, de l'auctorialité... d'un document numérique (donc toujours calculé), a fortiori dans un contexte collaboratif (au sens où le document est fruit d'un travail de plusieurs acteurs) ?

Les systèmes traditionnels de type bureautique proposent un ensemble d'outils pour répondre à cette question : enregistrement et gestion des modifications, comparaison de versions... Si ces fonctions conviennent peu ou prou dans des contextes d'usage peu exigeants en matière documentaire, pour peu qu'elles soient correctement utilisées, le passage à des contextes plus critiques - aéronautique ou pharmaceutique historiquement, en pratique la plupart des domaines professionnels aujourd'hui - requiert des fonctions de gestion complémentaires. Ces fonctions sont apportées par les systèmes de type ECM (Enterprise Content Management ou GED, Gestion Électronique de Document) : versioning, workflow... Cette solution pose de nombreux problèmes pratiques d'autant plus forts que les processus éditoriaux sont dynamiques et que les systèmes tendent à les rigidifier pour les contrôler. L'évolution vers des systèmes plus souples comme les CMS ou les Wiki en sont des témoins.

Les chaînes éditoriales XML collaboratives proposent une approche fondamentalement différente du couple bureautique/ECM en proposant d'intégrer la problématique de rééditorialisation au sein même du processus d'écriture, là où les systèmes bureautiques et d'ECM ne l'abordent que comme une surcouche sur un processus d'écriture qui cherche à mimer au plus près l'écriture traditionnelle (machine à écrire et feuille blanche pour le traitement de texte, rétro-projecteur et transparent pour la présentation assistée par ordinateur...). Elle est plus générale et plus radicale que les systèmes orientés vers la publication Web (CMS, Wiki...) en adressant tous types de documents, en séparant complètement la structure logique de la structure physique, en abstrayant un modèle documentaire permettant un contrôle plus en profondeur...

Un exemple typique de l'intrusion de la chaîne éditoriale dans le processus de rééditorialisation est la fragmentation-agrégation qui permet de découper un document en fragments réutilisables par référence (sans recopie, on parle de transclusion). Ainsi le document devient un réseau de fragments vivants au sein d'un fonds documentaire qu'exploite un réseau d'auteurs.

La question de la philologie est alors reposée en des termes très différents :

  • Un gain direct est par exemple le fait que le fragment réutilisé par référence est repérable par construction même, là où le copier/coller perd la référence à la source, posant des problèmes d'identification de l'origine - et donc de validité de l'information.

  • Un exemple de problème tout aussi direct est que la modification d'un fragment réutilisé au sein de plusieurs documents gérés par plusieurs utilisateurs est problématique par essence : la mise à jour doit-elle être propagée ou non ? La réponse à cette question dépendra en général du contexte auctorial ou éditorial, selon qu'elle modifie ou non en profondeur le sens du document qui la porte, que la diffusion de ce dernier supporte ou non des re-publications fréquentes...

Exemple caractéristique de problème posé lors de la mise à jour d'un fragment réutilisé au sein de plusieurs documents écrit par plusieurs auteurs (http://scenari.utc.fr/c2m/co/0103fragEtCol.html)
Exemple caractéristique de problème posé lors de la mise à jour d'un fragment réutilisé au sein de plusieurs documents écrit par plusieurs auteurs (http://scenari.utc.fr/c2m/co/0103fragEtCol.html)

Le problème posé est celui de la complexité de gestion induite par la rééditorialisation de documents structurés et fragmentés vivants. La thèse abordera cette question sous un angle philologique : c'est à dire qu'elle visera à concevoir des modèles et outils d'aide à la décision pour les utilisateurs de chaînes éditoriales collaboratives confrontés à la complexité de l'évolution de réseaux de fragments documentaires.