Processus d’édition

Nous avons colligé, dans ce site Web, l’essentiel des recherches, travaux et ouvrages publiés par Jean-Claude Boulanger au cours de sa carrière. La base de données qui alimente ce site contient les versions informatisées de 112 documents écrits ou coécrits par le chercheur (articles, comptes rendus et bibliographies), lesquels totalisent plus de 1500 pages imprimées. L’édition informatique de ces documents a été effectuée en suivant le processus d’édition décrit ci-dessous.

Numérisation, océrisation et toilettage

Tous les documents ont d’abord été numérisés. Certains documents numérisés étaient incomplets. Par exemple, il arrivait que les premières lettres de chaque ligne d’un texte reçu étaient effacées, en raison d’un problème de photocopie. Nous avons alors reconstitué le texte à partir de la version originale dans tous les cas possibles.

Chaque numérisation a ensuite été océrisée, c’est-à-dire qu’elle a été traitée au moyen d’un mécanisme de reconnaissance optique de caractères. Plus concrètement, chaque image matricielle (photographie numérique) a été convertie sous forme de chaînes de caractères (texte éditable) par un logiciel d’intelligence artificielle (qui simule des capacités typiquement humaines).

Le procédé d’océrisation étant imparfait, nous avons dû procéder à une phase de toilettage manuel pour obtenir une transcription textuelle de qualité. En effet, la conversion de l’image en texte provoque souvent l’apparition de nombreuses erreurs typographiques ou orthographiques (par exemple, dans un texte, la forme graphique ori gi nel*, avec des espaces indésirables, a été remplacée par le mot originel; dans un autre texte, les formes reconnues pzupta*, ztkntz*, nigAçtuda*, biatntk*, quibico i* ont été remplacées par les mots peuple, ethnie, négritude, beatnik, québécois).

Encodage, structuration et mise en page

Une fois toilettés, les textes ont été convertis en HTML5 (un langage de balisage informatique qui sert à créer des documents structurés diffusables sur le Web). Une partie du traitement a été effectuée automatiquement grâce à des expressions régulières.

Un travail de structuration manuelle s’est ensuite imposé. Les balises automatiquement générées ont été révisées de manière qu’elles représentent bien la structure du document. Ces balises sont constituées par des mots-clés conventionnels placés entre chevrons, tels que :

<header>…</header> (indique un en-tête);
<h1>…</h1> (indique un titre principal);
<p>…</p> (indique un paragraphe);
<blockquote>…</blockquote> (indique une citation de grande taille);
<li>…</li> (indique un élément de liste);
etc.

Nous avons également revu la structure des certains tableaux afin qu’ils se prêtent mieux à une présentation en ligne. Il est à noter que le contenu de certains tableaux des publications originales était désaligné, et parfois difficilement lisible; la restructuration des tableaux a permis de régler ce problème.

Les documents ont ensuite été couplés à une feuille de style CSS (un code qui sert à mettre en page du contenu), qui permet d’afficher le texte plus élégamment dans un navigateur Web (comme Firefox, Chrome, Safari, Edge, Opera, etc.). Cette opération permet aux documents de bénéficier d’une composition typographique moderne et uniforme.

Amélioration des visuels accompagnant les textes

Dans certains cas, les images qui accompagnaient les textes étaient de mauvaise qualité; elles provenaient sans doute de documents photocopiés à répétition ou numérisés à basse résolution.

Nous avons alors procédé à une seconde numérisation des images, en prenant soin de nous appuyer sur les documents originaux. Les images ont été numérisées avec des paramètres qui assuraient leur reproduction fidèle (à une résolution de 600 pixels par pouce, en mode couleur, sans effets de filtrage automatique ni compression). Les images numérisées ont ensuite été calibrées (retouches colorimétriques), alignées et recadrées à l’aide d’un logiciel de retouche de photographies. Les images conservent ainsi leur éclat d’origine.

De plus, nous avons redessiné quelques graphiques afin de rehausser leur apparence, en nous assurant de les enregistrer sous forme vectorielle, qui permet l’agrandissement des images sans l’apparition de crénelage (voir Boulanger 1983, Boulanger 2001, Cajolet-Laganière et autres 2004).

Uniformisation typographique

La typographie de l’ensemble des documents a dû être révisée et uniformisée. Par exemple :

Les apostrophes dactylographiques (droites) ont systématiquement été remplacées par des apostrophes typographiques (courbées). Les guillemets anglais (droits ou courbés) ont systématiquement été remplacés par des guillemets français (en chevrons), sauf dans les citations de second degré.
Les procédés de mise en relief typographiques ont été retouchés. Le soulignement, qui est en principe réservé aux hyperliens sur le Web, a intégralement été remplacé par de l’italique. Le gras a parfois aussi été remplacé par de l’italique, notamment lorsqu’il était utilisé comme seul procédé de mise en évidence. Lorsque le texte original comportait à la fois du gras et de l’italique, les deux procédés ont toutefois été conservés.
Certains textes sont passés d’une police à chasse fixe (qui rappelle l’écriture d’une machine à écrire) à une police plus moderne et sans empattements (qui est optimisée pour la lecture à l’écran).
La taille et le format des titres et sous-titres ont été unifiés. De même, les titres et sous-titres ont été retranscrits de façon à respecter les règles habituelles de casse (distinction entre majuscules et minuscules).
Le nom complet de chaque auteur et auteure a été rétabli avec la casse habituelle lorsqu’il était abrégé ou inscrit en majuscule sur les originaux (par exemple « J.-C. BOULANGER » devient « Jean-Claude Boulanger »). Les noms ont systématiquement été déplacés sous le titre. Lorsque le nom d’une institution d’attache (Université Laval, Office de la langue française, etc.) était explicitement mentionné, il a été repris entre parenthèses, à droite de la signature de la personne qui y est associée.
Lorsque les articles originaux étaient accompagnés de résumés, ces résumés ont systématiquement été placés à la fin des articles.
Lorsque les articles originaux comportaient des notes de bas de page, les appels de notes ont été retranscrits en exposant et entre crochets (par exemple « ^[1] ») et, le cas échéant, ont été transposés de manière à suivre une numérotation arabe continue (1, 2, 3…).

Correction de coquilles

Enfin, nous avons procédé à la correction de coquilles mineures repérées dans les textes originaux. Par exemple, la coquille

nécesité* a été remplacée par nécessité (Boulanger 1985);
mot à remplancer* a été remplacée par mot à remplacer (Boulanger 1989);
chalenged* a été remplacée par challenged (Boulanger 2000);
tout de Babel* a été remplacée par tour de Babel (Boulanger 2004);
quand au* a été remplacée par quant au (Boulanger 2006);
Une bibliographie signalétique de plus de 1000 titres sera vient d’être par l’auteur de cet article.* a été remplacée par Une bibliographie signalétique de plus de 1000 titres vient d’être publiée par l’auteur de cet article. (Boulanger 1982);
Quelles brèves remarques* a été remplacée par Quelques brèves remarques (Boulanger 1985);
l’énorme littéraire* a été remplacée par l’énorme production littéraire (Boulanger 1985).

Une attention particulière a été portée au rétablissement de caractères décalés ou erronément substitués par d’autres, en raison de problèmes d’encodage informatique ou de substitution de polices. Par exemple, la coquille

®* a été remplacée par → (Boulanger 1996);
[grãbjɛ]* a été remplacée par [ɡʀãbjɛ̃] (Boulanger 2002);
ŠUSI* a été remplacée par SUŠI (Boulanger, Malkowska 2008);
[βεγΘλ]* a été remplacée par [beɡœl] (Boulanger 2010).

En revanche, certaines graphies inusitées, mais régulières, ont été laissées telles quelles, considérant qu’il s’agissait sans doute de néologismes graphiques utilisés volontairement par l’auteur.