Introduction

Avec l'imprimerie s'est instaurée une « confiance dans la factualité des textes [et une] assurance dans leur établissement » (Cerquiglini, 1989, p. 17[1]). Il n'en est pas de même pour les textes antérieurs à cette invention, la recopie manuscrite ayant immanquablement entraîné la profusion de variantes. C'est ainsi qu'a émergé la discipline de la philologie, dont le but est d'établir la version de référence d'un texte en prenant pour témoins les variantes qui en subsistent, à défaut d'avoir conservé l'original.

La philologie est née avec la bibliothèque d'Alexandrie (288 avant JC) : les travaux d'édition menés par les grammairiens Zénodote, Aristophane de Byzance puis Aristarque de Samothrace ont notamment permis de fixer les premières versions de référence de l’œuvre d'Homère (fin du 8ème siècle avant JC), dont ils avaient hérité de nombreuses copies.

La méthode classiquement employée en philologie consiste à comparer plusieurs manuscrits en relevant les passages où ils divergent (collation), les différentes versions d'un même passage étant appelées leçons. La version de référence peut être établie par sélection du manuscrit considéré comme le meilleur représentant de l'original, ou bien par sélection, sur chaque passage, de la "meilleure leçon". Dans certains cas, les leçons non-fautives sont consignées dans l'apparat critique du texte édité.

Pour Cerquiglini (ibid.[1]), la philologie (particulièrement celle du 19ème) a longtemps reposé sur une « pensée de la faute », qui néglige le fait qu'un scribe ait pu faire lui-même un travail d'édition critique à partir de plusieurs sources, ou bien une réécriture consciente et valable (typiquement, des variantes syntaxiques ont pu être utilisées pour certains mots, alors même que l'orthographe n'était pas totalement fixée). Cette philologie s'est d'ailleurs montrée peu efficace pour l'édition des textes médiévaux (La Chanson de Roland, Le Lai de l'Ombre, etc.), dont la glose et la paraphrase étaient constitutives. À la « pensée de la faute », Cerquiglini oppose ainsi l'« éloge de la variante ».

En conclusion d'une contribution à la revue Genesis, Cerquiglini suggère que le numérique remet au jour la variance comme modèle d'écriture et appelle à une nouvelle philologie :

« De l'éloge de la variante à une apologie de l'hypertexte. Par sa non-linéarité, sa faible hiérarchisation, sa forte connectivité ce dernier fournit à l'édition critique le cadre notionnel et technique qu'elle requiert afin de rendre compte des processus scripturaux protéiformes et variants. Rompant avec le standard de l'imprimé, démultipliant la trace écrite par l'image et par le son, cette philologie hypertextuelle redonne vie par ailleurs à des pratiques d'appropriation culturelle et de production du savoir que le livre, dans son essor magistral, avait fâcheusement reléguées dans l'ombre ; elles se rallument avec nos écrans. » (2010[2])

Les travaux présentés dans ce mémoire s'inscrivent dans le domaine de l'ingénierie documentaire et dans le contexte technologique des chaînes éditoriales numériques. Plus précisément, notre recherche aborde la problématique de la relecture menée au sein de la production documentaire instrumentée par une chaîne éditoriale, qui selon nous s'inscrit dans le cadre d'une philologie des documents numériques. Nos travaux ont été menés dans le cadre des activités de recherche et développement menées conjointement par la société Kelis, éditeur de la suite logicielle Scenari, et l'unité Ingénierie des Contenus et des Savoirs (UTC).

En reconfigurant le document dans sa dimension technique, le numérique a transformé nos manières d'écrire, de lire et plus largement de penser, comme l'avait envisagé Vannevar Bush (1945[3]) dans son article « As we may think ». Devenu interactif, modifiable en permanence, rééditorialisable dans de nouveaux contextes, etc. le document numérique renouvelle en effet les conditions de production et d'accès aux savoirs, mais devient en même temps plus difficile à relire et à valider du fait de cette variance intrinsèque.

Cette problématique se manifeste en particulier au niveau des chaînes éditoriales, dont l'enjeu est de proposer de nouvelles fonctions d'écriture tirant parti des spécificités du support numérique. Pour y parvenir, ces systèmes reposent d'une part sur la séparation entre une forme génératrice et des formes publiées (Crozat, 2012a[4]), les secondes étant obtenues par différentes transformations de la première ; et d'autre part sur la fragmentation des documents au sein d'un graphe permettant d'instrumenter la rééditorialisation (Arribe, 2014[5]). Nous soutenons que le numérique, à la base de notre problématique, permet aussi de la résoudre à travers le polymorphisme, soit le fait d'engendrer différentes formes documentaires à partir d'une même forme génératrice. L'enjeu de notre recherche est alors de proposer des formes de relecture. Ces formes ont une visée philologique dans le sens où elles doivent être des versions de référence permettant au relecteur de valider efficacement un document.

En nous appuyant sur un ensemble de cas d'usage dans les chaînes éditoriales (modèles documentaires, corpus...) mettant en jeu les différentes propriétés du numérique identifiées dans la problématique, nous proposons deux stratégies de conception de formes de relecture : la linéarisation et la tabulation. Sur le plan expérimental, nous avons mis en en œuvre la linéarisation dans deux contextes d'usage, et développé un outil de relecture basé sur un algorithme de différentiel développé par Kelis.

Organisation du mémoire

Ce mémoire est structuré en cinq chapitres.

Le premier chapitre s'attachera à présenter les chaînes éditoriales et la relecture, et à identifier les questions émanant de leur articulation.

Le second chapitre élargira la question de la relecture au document numérique dans son ensemble, à travers l'analyse de trois de ses propriétés : l'instabilité, l'interactivité et la rééditorialisation. Rapportant cette question aux différentes formes documentaires mises en jeu dans les chaînes éditoriales, nous envisagerons la nécessité de concevoir des formes de relecture. Nous présenterons ensuite les éléments théoriques concernant la notion de document et son évolution avec le support numérique. Il nous permettra de mettre en lien les propriétés abordées dans ce chapitre avec un ensemble de tropismes caractérisant le numérique.

Le troisième chapitre explorera l'état de l'art concernant les fonctions d'aide à la relecture qui répondent partiellement à notre problématique. Trois fonctions seront présentées : le différentiel, l'annotation et la correction automatique.

Le quatrième chapitre présentera la linéarisation et la tabulation, qui constituent nos propositions théoriques.

Le cinquième chapitre donnera une vue des expérimentations que nous avons menées. Il détaillera les contextes d'usage abordés, les prototypes développés ainsi que les retours d'usage. Nous décrirons ensuite le cadre épistémologique dans lequel nous positionnons nos travaux et dresserons finalement un bilan de notre recherche.