Processus d’édition

Nous avons colligé, dans ce site Web, l’essentiel des recherches, travaux et ouvrages publiés par Jean-Claude Boulanger au cours de sa carrière. La base de données qui alimente ce site contient les versions informatisées de 112 documents écrits ou coécrits par le chercheur (articles, comptes rendus et bibliographies), lesquels totalisent plus de 1500 pages imprimées. L’édition informatique de ces documents a été effectuée en suivant le processus d’édition décrit ci-dessous.

Numérisation, océrisation et toilettage

Tous les documents ont d’abord été numérisés. Certains documents numérisés étaient incomplets. Par exemple, il arrivait que les premières lettres de chaque ligne d’un texte reçu étaient effacées, en raison d’un problème de photocopie. Nous avons alors reconstitué le texte à partir de la version originale dans tous les cas possibles.

Chaque numérisation a ensuite été océrisée, c’est-à-dire qu’elle a été traitée au moyen d’un mécanisme de reconnaissance optique de caractères. Plus concrètement, chaque image matricielle (photographie numérique) a été convertie sous forme de chaînes de caractères (texte éditable) par un logiciel d’intelligence artificielle (qui simule des capacités typiquement humaines).

Le procédé d’océrisation étant imparfait, nous avons dû procéder à une phase de toilettage manuel pour obtenir une transcription textuelle de qualité. En effet, la conversion de l’image en texte provoque souvent l’apparition de nombreuses erreurs typographiques ou orthographiques (par exemple, dans un texte, la forme graphique ori gi nel*, avec des espaces indésirables, a été remplacée par le mot originel; dans un autre texte, les formes reconnues pzupta*, ztkntz*, nigAçtuda*, biatntk*, quibico i* ont été remplacées par les mots peuple, ethnie, négritude, beatnik, québécois).

Encodage, structuration et mise en page

Une fois toilettés, les textes ont été convertis en HTML5 (un langage de balisage informatique qui sert à créer des documents structurés diffusables sur le Web). Une partie du traitement a été effectuée automatiquement grâce à des expressions régulières.

Un travail de structuration manuelle s’est ensuite imposé. Les balises automatiquement générées ont été révisées de manière qu’elles représentent bien la structure du document. Ces balises sont constituées par des mots-clés conventionnels placés entre chevrons, tels que :

Nous avons également revu la structure des certains tableaux afin qu’ils se prêtent mieux à une présentation en ligne. Il est à noter que le contenu de certains tableaux des publications originales était désaligné, et parfois difficilement lisible; la restructuration des tableaux a permis de régler ce problème.

Les documents ont ensuite été couplés à une feuille de style CSS (un code qui sert à mettre en page du contenu), qui permet d’afficher le texte plus élégamment dans un navigateur Web (comme Firefox, Chrome, Safari, Edge, Opera, etc.). Cette opération permet aux documents de bénéficier d’une composition typographique moderne et uniforme.

Amélioration des visuels accompagnant les textes

Dans certains cas, les images qui accompagnaient les textes étaient de mauvaise qualité; elles provenaient sans doute de documents photocopiés à répétition ou numérisés à basse résolution.

Nous avons alors procédé à une seconde numérisation des images, en prenant soin de nous appuyer sur les documents originaux. Les images ont été numérisées avec des paramètres qui assuraient leur reproduction fidèle (à une résolution de 600 pixels par pouce, en mode couleur, sans effets de filtrage automatique ni compression). Les images numérisées ont ensuite été calibrées (retouches colorimétriques), alignées et recadrées à l’aide d’un logiciel de retouche de photographies. Les images conservent ainsi leur éclat d’origine.

De plus, nous avons redessiné quelques graphiques afin de rehausser leur apparence, en nous assurant de les enregistrer sous forme vectorielle, qui permet l’agrandissement des images sans l’apparition de crénelage (voir Boulanger 1983, Boulanger 2001, Cajolet-Laganière et autres 2004).

Uniformisation typographique

La typographie de l’ensemble des documents a dû être révisée et uniformisée. Par exemple :

Correction de coquilles

Enfin, nous avons procédé à la correction de coquilles mineures repérées dans les textes originaux. Par exemple, la coquille

Une attention particulière a été portée au rétablissement de caractères décalés ou erronément substitués par d’autres, en raison de problèmes d’encodage informatique ou de substitution de polices. Par exemple, la coquille

En revanche, certaines graphies inusitées, mais régulières, ont été laissées telles quelles, considérant qu’il s’agissait sans doute de néologismes graphiques utilisés volontairement par l’auteur.