La nature et le dessin des mots dans les dictionnaires de langue[1]

Jean-Claude Boulanger (Université Laval)

1. Lexique et dictionnaire

Pour le lexicologue et le grammairien, le mot est l’unité du lexique. L’identité d’un mot, sa reconnaissance, son existence même sont fixées à partir de trois critères d’ordre linguistique. Le mot a une forme (le signifiant), il possède un sens (le signifié) et il appartient à une partie du discours (la catégorie grammaticale). Un morphème non catégorisé ne serait alors pas un mot (pré-, macro-, sous-; -eur, -cole, -zéro) alors qu’une marque déposée en serait un (Deltaplane, n.m., Solderie, n.f., Jeep, n.f. en France, n.m. ou n.f. au Québec).

Le mot est aussi l’unité du dictionnaire, sa donnée fondamentale. Globalement, son identité est la même que l’unité lexicale de la langue. Quoique l’introduction d’un mot dans le dictionnaire soit liée à un quatrième critère : la lexicalisation, à savoir la recevabilité sociale. Mais l’unité lexicographique revendique une définition plus nuancée, car elle s’ouvre sur d’autres perspectives. D’une part, parfois elle n’atteint pas le niveau du lexique, d’autre part, elle le dépasse souvent. Ce sera l’objet de ce texte que de dessiner le profil du mot hors dictionnaire et celui du mot dans le dictionnaire.

Pour examiner et scruter l’envergure du vocable lexicographique, nous nous arrêterons strictement aux diverses variations formelles du mot dictionnairique puisqu’avant toute chose, c’est cet aspect qui saute aux yeux du consulteur. Il faut d’abord examiner sa nature, c’est-à-dire ses relations avec le lexique; puis son dessin, c’est-à-dire les configurations ou les physionomies qu’il peut emprunter dans les nomenclatures.

Le mot du dictionnaire est tantôt équivalent ou équipollent au mot du lexique tel que le définissent les grammaires traditionnelles; tantôt il est plus petit que lui et tantôt il est plus grand. Ce qui autorise à dire que non seulement le lexicographe clôt le lexique de la langue, mais qu’il ouvre aussi une brèche vers des modèles d’unités ou de signes qui ne sont pas reçus par les linguistes et les grammairiens ou qui sont repoussés par eux dans d’autres catégories de signes. Les frontières du lexique dictionnairique ne sont pas fixées d’une manière absolue. La plupart des unités consignées ont un signifiant, un signifié et une catégorie grammaticale (enfant, n.m., feuille, n.f., marcher, v., dîner, n.m. ou v.); d’autres ont un signifiant et un signifié, mais pas de catégorie grammaticale (anti-, -erie); d’autres ont un signifiant, parfois une catégorie grammaticale, mais pas de signifié au sens strict ou un signifié difficile à circonscrire (les lettres de l’alphabet : a, h, c; les noms propres : Noël, n.m., et parfois n.f., Québec, n.m. (État) ou ∅ (ville), Kaposi, ∅) —les proprionymes sont des unités singularisantes pour la plupart; certains comme Noël étant récursifs identifient plusieurs objets du monde, ils pourraient alors posséder un signifié—; d’autres ont un signifiant, un signifié et une catégorie grammaticale, mais elles ne sont pas des noms communs comme les autres ni des proprionymes ou des noms propres tout à fait comme les autres (Digicode, n.m., Kevlar, n.m.), etc.

En lexicologie et en lexicographie, le concept de « mot » s’interprète ou se décline différemment, tout en reposant sur des fondements communs.

2. Les archives d’un état de langue ou la nomenclature

Après avoir mis au point son programme macrostructurel, le premier geste du lexicographe est d’établir la liste des mots de la langue telle qu’il la perçoit au moment de la rédaction de son ouvrage. Cette entreprise d’inventaire des mots est depuis toujours soumise à des décisions et à des justifications qui relèvent du projet de dictionnaire défini. Le catalogue des formes du dictionnaire est dit la nomenclature, elle-même constituée des entrées (les mots).

Si le mot constitue l’unité par excellence du lexique et de la grammaire, dans le dictionnaire, il est lié à une triple dépendance fonctionnant par imbrication :

  1. La macrostructure, qui représente le modèle théorique retenu, l’architecture formelle de l’ouvrage.
  2. La nomenclature, qui concrétise l’ensemble de l’extrait lexical sélectionné et ses compléments non lexicaux.
  3. Les entrées, qui sont les unités diversement configurées sur lesquelles portent les prédications articulaires.

Les équations qui suivent résument le tout.

macrostructure architecture formelle principe théorique
nomenclature ensemble des formes liste finie
entrées unités individualisées extraits de la liste

En opérant un choix dans le lexique total, le lexicographe ferme le lexique. « En ce sens, la nomenclature est un discours clos sur lui-même, qui normalise une liste finie d’éléments dans l’ensemble non fini du lexique » (Collinot et Mazière 1997 : 54). Ainsi s’élabore la partie de la nomenclature qui puise dans les archives strictement lexicales de la langue, c’est-à-dire dans le stock d’unités qui correspond à la définition grammaticale la plus générale du mot mot : « Forme libre douée de sens qui entre directement dans la production de la phrase » (Nouveau Petit Robert [→ NPR]). C’est à cette image du mot qu’adhère Paul Imbs quand il dit que la « nomenclature est la somme des mots différents révélés par ces champs [d’actualisation du lexique], certes dégagés de l’environnement sémantique et syntaxique qu’ils y reçoivent, mais justifiés par lui (...) » (1971 : XXVII). Or il s’avère, comme on le verra, que la réalité nomenclaturelle dépasse en fait largement cette affirmation puisque de nombreuses unités décrites dans les dictionnaires ne sont pas des signes du lexique. Le catalogue primaire sera complété en puisant des entrées dans d’autres réservoirs de signes.

Mais les lexicographes ne s’interrogent guère sur cette question, même si les gestes qu’ils posent vont dans le sens de l’élargissement de ce qu’il est convenu d’appeler le lexique. Dans la section introductive du NPR justement intitulée « Les mots du dictionnaire », les indications fournies par Josette Rey-Debove et Alain Rey au sujet des signes de la nomenclature se résument à dire que celle-ci est vaste puisque le dictionnaire « répertorie près de 60.000 mots » (1995 : XI), qu’on y recense diverses catégories de mots et qu’on trouve aussi « des éléments de formation savants » (1995 : XI). La dernière remarque identifiant des formants est renforcée par la phrase suivante, qui détache les morphèmes liés du mot : « Un mot (ou un élément) qui figure à la nomenclature est appelé entrée, et cette entrée donne matière à un article » (Rey-Debove et Rey 1995 : XI). Les lexicographes avertissent donc les utilisateurs que le mot du dictionnaire se prolonge dans la zone des morphèmes liés.

Ainsi s’édifient les nomenclatures. Celles-ci résultent alors de multiples choix qui varient avec les entreprises dictionnairiques et/ou les programmes établis pout chaque dictionnaire (voir le tableau 1 : sur 26 possibilités, il y a accord dans seulement 6 cas). Elles sont des représentations empiriquement fédérées des possibilités d’expression d’une langue qui sont rendues sous la forme d’un catalogue d’entrées généralement ordonnées alphabétiquement.

Tableau 1 : Séquence de pomélo à pomoerium dans quelques dictionnaires.
PLI 1997 NPR 1995 DFP RJINA
pomelo pomélo pomélo
pomerium pomérium pomerium
pomerol pomerol
pomi-
pomiculture
pomiculteur [pomiculteur] pomiculteur
pommade pommade pommade pommade
pommader pommader pommader
pommard pommard pommard
pomme pomme
1. pomme 1. pomme
2. pomme 2. pomme
pommé pommé pommé
pommeau pommeau pommeau pommeau
pomme de terre pomme de terre pomme de terre pomme de terre
pommelé pommelé pommelé pommelé
pommeler (se) pommeler (se) pommeler (se)
pommelle pommelle pommelle
pommer pommer pommer
pommeraie pommeraie pommeraie
pommeté pommeté pommeté
pommette pommette pommette pommette
pommier pommier pommier pommier
porno-, pomi-
pomoculture pomoculture
pomoerium pomoerium pomoerium
21 24 [+1] 18 9

2.1. Langue commune, usage et discours

En associant le lexique à des contraintes programmatiques, donc en recensant des unités attestées et sélectionnées parmi une multitude de séries possibles, le lexicographe élit et oriente un ou des usages dans l’infinité et dans la diversité des pratiques langagières. La nomenclature peut dès lors être appréhendée comme un discours d’institution ou d’entreprise et une tranche de langue normalisée. Cataloguée et instaurée suivant ce principe, elle peut être qualifiée de différentes manières du point de vue de sa légitimation, c’est-à-dire de sa reconnaissance.

  1. Les mots décrits sont réputés former la langue commune, celle des francophones, comme dans le NPR, dans le Trésor de la langue française [→ TLF] et dans d’autres recueils. Ainsi, pour Paul Imbs, « le dictionnaire tel que nous le concevons doit comprendre le vocabulaire de la langue commune à tous les francophones ayant reçu une (...) culture de type humaniste (...) » (1971 : XXIV). Quant au NPR, les auteurs du texte introductif précisent que leur dictionnaire est « la description d’un français général, d’un français commun à l’ensemble de la francophonie, coloré par des usages particuliers, et seulement lorsque ces usages présentent un intérêt pour tout le monde » (Rey-Debove et Rey 1995 : XIII). Notons que Paul Imbs utilise l’expression le vocabulaire (article défini) tandis que Josette Rey-Debove et Alain Rey parlent d’un français commun (article indéfini). La restriction est ailleurs, dans l’intérêt collectif... des Français, ce qui est parfaitement compréhensible du point de vue des auteurs de dictionnaires en France. Cependant, ces discours sont loin de la réalité puisque de nombreux mots figurant dans les dictionnaires n’ont aucune résonance en dehors de la France (certains francismes), de nombreux mots communs à la francophonie et de nature à intéresser tous les locuteurs n’y apparaissent pas (certains francophonismes), sans compter que de nombreux mots régionaux connus en France sont absents (certains régionalismes intrahexagonaux) et que de nombreux mots régionaux propres aux autres communautés francophones sont ignorés (certains régionalismes extrahexagonaux). Je n’insiste pas plus sur ces problèmes de la variation et des autodescriptions qui relèvent d’autres études et d’autres préoccupations.
  2. Les mots décrits sont réputés constituer l’usage reçu, c’est-à-dire normé. De fait, l’opération de sélection de la nomenclature est la deuxième étape de la normalisation, la première étant définie lors de l’établissement du programme macrostructurel, et elle est certainement d’ordre idéologique. Le marquage des registres de langue formera la troisième étape normative et diverses autres observations sur l’usage formeront la quatrième. L’ensemble lexical décrit fournit une image de la norme qui est surdimensionnée par une synchronie, un espace et une société donnés. C’est pour cela qu’un locuteur non français percevra le NPR et le Petit Larousse illustré [→ PLI] comme des dictionnaires idéals pour les locuteurs de France et que certaines personnes voudront imposer ce modèle dans d’autres régions (Québec, Belgique...). Par rapport à sa propre position dans le triangle temps-diatopie-société, le francophone périphérique sentira les mêmes dictionnaires comme étant moins performants pour sa variété de langue.

Le découpage dans le lexique est un acte normatif. Ce qui demeure dans le filtre est inséré dans un ensemble hiérarchisé du plus normatif au moins normatif, le niveau non marqué indiquant la situation normale, ni au-dessus de la norme, ni surtout en dessous. Car s’écarter de la norme renvoie aussi bien à ce qui appartient à des usages situés au-dessus de la barre normative (usage soutenu, littéraire, etc. : bouscueil, pagée au Québec, quasi, souventefois en France) qu’à ce qui loge à l’enseigne placée sous la barre normative (usages familiers, argotiques, vulgaires ou autrement dévalués).

Les remarques portant sur la légitimation reposent sur le « référentiel de la langue commune » (Collinot et Mazière 1997 : 68). La référence renvoie à trois réseaux de discours.

  1. Le discours qui est à la source de l’information lexicographique. Dans les dictionnaires élaborés en France, tous les énoncés sont formulés pour les Français en priorité, même ceux qui concernent les dimensions diatopiques des entrées (NPR → mitaine : « Moufle », également identifié comme canadianisme). Le discours est normal, mais les faits ne concordent pas tout à fait avec la stratégie discursive énoncée dans les textes de présentation. Ici, le mot est expliqué aux utilisateurs français du dictionnaire.
  2. Le discours qui constitue la compétence langagière de l’usager du dictionnaire. On se réfère ici à la connaissance active et passive du vocabulaire par le locuteur. Personne ne connaît tous les mots du dictionnaire et tout le monde connaît des mots qui n’y sont pas consignés. Sans évoquer à ce sujet la question de la variation linguistique. Ici encore, les faits s’éloignent de la stratégie discursive énoncée dans les textes de présentation.
  3. Le discours qui fonde le savoir du lexicographe sur la langue. Il n’est guère possible de gérer la connaissance totale du lexique dictionnarisé. Tous les sous-ensembles lexicaux, du plus normé aux plus familiers, vulgaires ou scientifiques, résultent eux-mêmes de choix que le lexicographe effectue ou fait réaliser sans nécessairement posséder toutes les qualités pour le faire. « Aucun lexicographe n’a pu, jusqu’ici, opérer un tri dans le vocabulaire scientifique et technique autrement que par référence à un type de locuteur idéal qu’il définit le plus souvent par transposition du niveau de culture qui lui est propre ou qui est commun à une équipe d’amis et d’informateurs » (Guilbert, Lagane et Niobey 1971 : II-III).

C’est dire que le lexicographe ne peut établir sa nomenclature sur des bases purement objectives, même s’il le souhaite. Le dictionnariste est le porte-parole d’un groupe de locuteurs qui forment la collectivité. Lui-même fait partie de cette classe de personnes. « H est à la fois dans la langue et dans la culture et en dehors de celles-ci de par son activité d’observateur des pratiques langagières communes à son milieu » (Collinot et Mazière 1997 : 69). Le lexicographe est donc toujours en porte-à-faux par rapport à l’usage qu’il fait personnellement de la langue et la description qu’il en propose.

2.2. Arrêt sur l’image

Ce long détour avait pour objectif de montrer qu’il existe des critères de sélection des unités dans le lexique et hors du lexique, qu’il existe des critères de définition et de légitimation des mots qui formeront la nomenclature. Le processus de délimitation concerne la nature et le nombre des entrées. Il appartient au programme macrostructurel. Les deux autres processus, la légitimation et la définition, découlent du programme microstructurel.

Pour ma part, je voudrais m’arrêter sur un aspect du volet de la macrostructure et examiner puis classifier les diverses sortes de mots que l’on trouve dans la rubrique entrée des dictionnaires de langue. Jusqu’à maintenant, on n’a guère exploré l’aspect formel des mots du dictionnaire par rapport aux mots du lexique de la langue ni tenté de les répartir sur une échelle qui va du mot au non-mot, c’est-à-dire essayer de les hiérarchiser. L’accent sera donc mis sur les signifiants, les signifiés étant toujours présents, mais mis en sourdine pour l’occasion.

3. Les lexiques de la nomenclature

Lorsque l’on dit que le mot du dictionnaire est à la fois plus et moins que le mot du lexique, on touche là le cœur du mot et de sa définition en langue et en lexicographie. Ainsi, Coca-Cola, Frigidaire, Nescafe et Restoroute sont des mots du dictionnaire (voir le NPR qui les retient, mais sans majuscules initiales) sans être nécessairement des mots du lexique. H s’agit ici de quatre marques déposées —le NPR en contient près de 200— qui sont en réalité des proprionymes ou des noms propres qui se sont lexicalisés, mais que les propriétaires légitimes ne veulent pas voir échapper à leur contrôle et glisser dans le lexique usuel et ainsi en perdre la jouissance. Mais ces unités sont-elles vraiment des noms proprionymiques, ceux-ci étant réputés ne pas posséder de signifié et être singularisants? Pour Josette Rey-Debove, ces « mots restent en fait des noms propres bien qu’ils désignent un type d’objet, et méritent par là d’être traités en noms communs » (1971 : 88; voir aussi Rey 1977 : 30-31). Voilà certes une manière élégante de réconcilier les deux statuts. À l’égal du nom commun, les référents des marques déposées sont multiples (voir aussi Épiphanie et Noël). On les trouve parfois lexicalisées dans d’autres langues sans qu’intervienne le phénomène de l’emprunt en cascade. Le dictionnaire dira donc que Coca-Cola, Frigidaire, Nescafe et Restoroute ne sont pas des mots comme les autres, puisque ce sont des marques déposées, mais qu’ils sont néanmoins suffisamment près de la langue générale pour qu’on en fasse des unités de nomenclature et qu’on fasse état de leur utilité et de leur fonctionnement en langue. H en va de même pour des noms propres comme Épiphanie, Noël ou Pâques.

3.1. L’image lexicographique du mot

Le dictionnaire de langue est un catalogue de mots rangés selon l’ordre alphabétique, plus rarement systématique, de ses composants, les graphèmes, à savoir les lettres, qui constituent les entrées. Une suite de graphèmes en minuscules ou en petites capitales, auxquels s’adjoignent parfois des signes diacritiques variés (le trait d’union, l’apostrophe, la barre oblique, le tiret pour les affixes...), forme un mot lexicographique :

visage v + i + s + a + g + e
pourboire p + o + u + r + b + o + i + r + e
porte-parole p + o + r + t + e + [-] + p + a + r + o + l + e
aujourd’hui a + u + j + o + u + r + d + [] + h + u + i
et/ou e + t + [/] + o + u
giga- g + i + g + a + [-]

Ces six exemples représentent les éléments formels des dictionnaires et cinq de ces modèles configurent la grande majorité des contenus de nomenclature. Le modèle et/ou est plus récent et encore rare. L’unité lexicale complexe sera traitée plus loin.

L’adresse est le phare du dictionnaire général monolingue (DGM), la voie d’accès privilégiée (voir le terme entrée) à une séquence d’énoncés rangés et détaillés dans les articles. Ces discours sont situés à différents niveaux linguistiques, ou reliés à des représentations visuelles elles-mêmes situées à différents niveaux iconographiques. La suite des énoncés ou des rubriques configure l’article de dictionnaire modélisé par la macrostructure. Les entrées sont généralement classées alphabétiquement. Seule la logique de l’ordre alphabétique —qui, sur le plan linguistique, constitue un désordre— permet de pénétrer au cœur du contenu d’un article, à moins bien entendu d’explorer le dictionnaire au hasard ou à l’aveuglette ou à l’aide d’un cédérom. Les cédéroms et les liens hypertextes introduisent de nouveaux mécanismes de consultation qui perturbent cette démarche séculaire en ce qu’ils rendent la disposition alphabétique moins stratégique. Mais les technologies nouvelles ne changent rien à la raison d’être du dictionnaire, à savoir que la moindre information orbite autour du mot d’entrée. C’est sur lui que portent tous les efforts descriptifs.

Les entrées et les rubriques articulaires ainsi que les illustrations modélisent les trois dimensions fondamentales des dictionnaires de langue : la macrostructure, la microstructure et l’iconostructure. Le dictionnaire s’organise donc autour d’un schéma ternaire qui constitue son écologie textuelle et sémiotique, et qui est le support de sa grammaire et de sa rhétorique spécifiques. Il entre alors dans un genre littéraire bien particularisé qui a ses propres règles. Bien entendu, il ne saurait y avoir de dictionnaire qui explique le fonctionnement linguistique des unités retenues sans macrostructure, mais il peut y en avoir avec une microstructure très minimale et/ou sans iconostructure.

L’entrée est le sujet de divers prédicats, c’est-à-dire d’une variété de discours linguistiques (les rubriques ou les énoncés articulaires). Chaque rubrique microstructurelle traite d’un domaine de la linguistique ou de plusieurs à la fois : entrée (= orthographe, grammaire, morphologie, parfois la syntaxe), étymologie et datation (= histoire de la langue, caractéristiques philologiques), définition et renvois analogiques (= sémantique), exemples et citations (= syntaxe), etc. Lue horizontalement, c’est-à-dire, mise en rapport avec les éléments fonctionnels qui en sont les prédicats marqueurs de propriétés, l’entrée peut être analysée comme une forme sur laquelle sera prononcée une série de jugements —en priorité d’ordre linguistique— qui interpellent son environnement distributionnel. L’entrée est également une prédication sur elle-même puisqu’on y décode des renseignements sur l’orthographe, les variantes graphiques, la morphologie, la grammaire...

L’adresse dictionnairique est une forme neutralisée, canonique qui représente toutes les flexions du mot lexical, comme le montre des exemples comme danseur, final, marcher et vert qui sont les témoins de toutes les formes possibles en discours (voir le tableau 2).

Tableau 2 : L’entrée et le discours.
Exemples d’entrées du NPR
Entrées Réalisations discursives
danseur, euse danseur, n. masc. sing.
danseurs, n. masc. plur.
danseuse, n. fém. sing.
danseuses, n. fém. plur.
final, ale, als ou aux final, adj. masc. sing.
finals, adj. masc. plur.
finaux, adj. masc. plur.
finale, adj. fém. sing.
finales, adj. fém. plur.
marcher → voir l’appel de conjugaison : < 1 >
vert, verte vert, adj. masc. sing.
verts, adj. masc. plur.
verte, adj. fém. sing.
vertes, adj. fém. plur.

L’entrée objectivise toutes les occurrences réalisables dans des discours oraux ou écrits. Elle est une convention de l’appareil métalangagier du dictionnaire pour nommer l’une des figures du mot utilisé par un locuteur dans un énoncé. À travers un représentant et une catégorie (voir les verbes dans les dictionnaires latins où la forme canonique d’accès est la première personne du singulier du présent : amo et non amare), toutes les virtualités sont alors envisagées et décrites. La zone strictement morphologique ou grammaticale de la rubrique entrée renforce ce principe. Dans le NPR, de ici à il, il y a 97 articles dont 18 (= 18,6 %) se prévalent de ce renforcement (voir le tableau 3).

Exemples d’entrées à expansion : ici - il [→ NPR]

Tableau 3 : L’entrée et les zones morphologique et/ou grammaticale.
Entrées Commentaires
icon(o)- élément de formation (v. le tiret)
variante graphique (v. les parenthèses)
1. idéal, ale, als ou aux le chiffre 1 marque l’homonymie
l’absence de aies indique un pluriel régulier
variante grammaticale du masculin pluriel (v. le ou)
2. idéal, als ou aux le chiffre 2 marque l’homonymie
variante grammaticale du masculin pluriel (v. le ou)
idéalisateur, trice morphème du féminin
idéel, elle morphème du féminin
identificateur, trice morphème du féminin
idéo- élément de formation (v. le tiret)
idéomoteur, trice morphème du féminin
idio- élément de formation (v. le tiret)
idiot, idiote forme du féminin au long
igloo ou iglou variante graphique (v. le ou)
indication de la synonymie (v. le ou)
igné, ée morphème du féminin
igni- élément de formation (v. le tiret)
ignifugeant, ante morphème du féminin
ignipuncture ou igniponcture variante graphique (v. le ou)
indication de la synonymie (v. le ou)
ignominieux, ieuse morphème du féminin
ignorant, ante morphème du féminin
ignorée, ée morphème du féminin

Pour que les statistiques soient complètes, il faudrait rajouter les trois entrées cachées, c’est-à-dire les formes reléguées à la toute fin de l’article du mot dont ils dérivent, moyennant certaines conditions (voir Rey-Debove et Rey 1995 : XI-XIl). Les entrées cachées font partie des nomenclatures. En réalité, de ici à il, on compte 100 unités de nomenclature.

Entrées Entrées cachées
iconographie iconographique
iconologie iconologiste ou iconologue
icosaèdre icosaédral

Outre les discours prédicatifs, l’adresse est aussi très souvent le sujet d’une illustration qui montre ce qu’est l’objet dans l’univers (voir le PLI). Ces représentations iconographiques prennent plusieurs configurations allant du simple dessin esquissé à la photographie en couleurs détaillée. Il peut s’agir aussi d’un tableau ou d’une liste (par exemple, les monnaies dans le PLI).

4. La macrostructure

Le mode de disposition des unités lexicales dans la rubrique entrée constitue l’architecture formelle du dictionnaire ou encore le squelette du dictionnaire. Ce modèle, c’est la macrostructure. Elle configure un catalogue de titres (= les mots) dont la lecture s’effectue verticalement et se fonde sur un système de classement, par exemple le déroulement alphabétique strict, qui est le modèle de plus courant. L’entrée se détache clairement de la suite du texte articulaire, et cela en vertu de sa typographie spécifique. Dans la série d’exemples précédents (voir le tableau 3), seul le premier élément de ces entrées est pris en considération à l’étape de la sélection de la nomenclature. Le décodage horizontal de la suite fait déjà partie des prédications fonctionnelles, et donc du modèle microstructurel.

Lecture verticale Lecture horizontale
icono- icono- ou icon-
idéal 1. idéal, idéales, idéals ou idéaux
2. idéal, idéals ou idéaux
idéalisateur idéalisateur ou idéalisatrice
[...] [...]
igloo igloo ou iglou

Par rapport au lexique qui demeure un ensemble ouvert, la suite de mots clos et ordonnés alphabétiquement ou autrement s’appelle la nomenclature. L’analyse verticale met l’entrée en rapport de dépendance avec toutes les autres adresses. C’est pour cela que l’on dit qu’elle appartient à la nomenclature et qu’elle « peut

être perçue comme une figure de signe, une unité sémiotique appartenant au système de la langue » (Collinot et Mazière 1997 : 83). L’axe vertical interpelle un statut dans le lexique ou dans d’autres catégories de signes linguistiques ou non linguistiques. Ces signes sont tous de nature sémiotique. Le lexique dictionnairique est fermé parce que la nomenclature résulte d’un choix fondé sur un programme à la fois linguistique, culturel, sociétal, pédagogique ou didactique et, ne l’oublions pas, à caractère économique et financier. En amont, se détache les principes idéologiques. La nomenclature est la réalisation concrète de la macrostructure (voir les tableaux). La macrostructure est un ensemble programmé d’éléments abstraits, c’est-à-dire un mode de construction des entrées (morphèmes grammaticaux liés —affixes et éléments savants— mots simples, composés, unités lexicales complexes (ULC), symboles, proprionymes...) et une limite quantitative (la taille des dictionnaires : 20.000, 30.000, 40.000 mots). On dira que la macrostructure de tel dictionnaire s’élève à 60.000 entrées (= amplitude du dictionnaire culturel et types d’unités) alors que pour la nomenclature, on parlera des 60.000 mots réalisant cet ordre de grandeur. Lorsque l’on utilise la méthode du dégroupement/regroupement, on dira qu’une macrostructure est double et non que sa nomenclature est double, comme celle du Dictionnaire québécois d’aujourd’hui [→ DQA] et celle de plusieurs dictionnaires pour enfants.

La macrostructure fait donc référence aux types de mots retenus (ceux provenant du lexique des noms communs, du domaine des noms propres, du groupe des marques déposées, etc.), à leur mécanique de distribution : le rangement alphabétique strict ou partiel, le regroupement affixal (Lexis) ou suffixal (DQA) et le dégroupement, les entrées renvois (NPR : hélodéeélodée) et les entrées cachées (NPR : hémiédriehémièdre ou hémiédrique).

Selon les auteurs, les termes macrostructure et nomenclature peuvent être synonymes ou non. « La macrostructure est couramment nommée la nomenclature » (Rey-Debove 1971 : 21). Voir la définition qui suit.

macrostructure : « (...) ensemble des entrées ordonnées, toujours soumises à une lecture verticale partielle lors du repérage de l’objet du message » (Rey-Debove 1971 : 21).

La tendance récente est de les distinguer.

La nomenclature peut être :

  1. Extensive, c’est-à-dire la plus complète possible pour les états de langue traités (TLF).
  2. Intensive, c’est-à-dire la plus exhaustive possible pour un état de langue donné, pour une période choisie, un champ donné (Grand Larousse de la langue française [→ GLLF], DQA, pour le français québécois actuel).
  3. Sélective, c’est-à-dire réduite à l’essentiel pour un état de langue donné, pour une période visée, pour un champ donné, pour un public spécifique (Dictionnaire CEC Jeunesse, Robert junior illustre).

4.1. Les unités macrostructurelles

Les unités vedettes des dictionnaires permettent d’obtenir une vision concrète du mot et du lexique. Passer par le dictionnaire pour constater quels visages empruntent les entrées est un excellent moyen de savoir ce qu’est un mot. On se situe alors à un niveau d’application de la théorie des morphèmes et de celle du mot. Les entrées de dictionnaire sont souvent interprétées comme un discours dont l’objet s’avère être une théorie implicite du mot (voir Collinot et Mazière 1997 : 82). La grande majorité des entrées sont des unités codées.

Lorsque l’unité choisie pour respecter le programme macrostructurel est le mot au sens grammatical, « c’est-à-dire une unité de première articulation fonctionnant comme partie du discours (mot fonctionnel, ‘graphique’ ou non (voir les ULC)), la nomenclature du dictionnaire est un ensemble structuré ou macrostructure, dont les éléments sont les mots » (Rey-Debove 1969 : 185). Mais à y regarder de près, on s’aperçoit rapidement que ces « mots » appartiennent à différentes catégories qui servent à tramer la chaîne des nomenclatures dictionnairiques (voir Boulanger 1995). Il y a en entrée de dictionnaire des signes sans signifié, comme les proprionymes, mais qui sont indispensables pour construire des signifiés (NPR → Machnombre de Mach) (voir Boulanger et Cormier 1998). Cette zone grise mérite un coup d’oeil ainsi que l’idée de « mot » dont on élargira la conception.

Il n’est guère besoin de feuilleter longuement un recueil lexicographique pour remarquer que les vedettes n’ont pas toutes une physionomie de famille (voir les tableaux 1 et 3). L’entrée lexicographique n’est pas toujours le mot entendu dans son sens traditionnel de bloc graphique isolé dans un texte entre deux blancs ou d’autres signes diacritiques. Elle se situe entre la lettre (a, b, c) et la phrase indépendante (je ne sais quoi, qu’en-dira-t-on), en passant par le fragment phrastique (pourboire, quant-à-soi, revenez-y, y-a-qu’a) (voir Rey-Debove 1971 : 23). Elle déborde également du côté du non-mot lexical. Quatre grands amas d’unités se présentent aux yeux de l’observateur. Ils seront dénommés par rapport à la définition du mot donnée du point de vue du lexique.

4.1.1. Les inframots

Les entrées infralexicales ou les inframots, c’est-à-dire les morphèmes liés (préfixes, suffixes, autres éléments de formation) : Grand Robert de la langue française [→ GRLF] → ana- (anachronisme), -ana (Voltairiana) « collection », géo- (géographie), -thèque (vidéothèque). En principe, même si elles sont codées, ces unités n’ont pas d’autonomie lexicale, elles n’existent pas seules dans la langue. Elles doivent toujours être associées à une base ou à un autre morphème lié pour former avec eux un mot fonctionnel, un morphème libre (voir NPR → pomi-/pomo- : pomiculture/pomoculture). Le tiret qui les suit —pour les préfixes (NPR → ana-, in-)— ou qui les précède —pour les suffixes (NPR → -ana, -in)— signale leur statut de morphèmes grammaticaux, de pré-mots, de composants possibles pour l’unité lexicale. Au fil du temps, quelques affixes se sont lexicalisés transférant par le fait même la charge sémantique dont ils sont porteurs sur une unité libérée. C’est le processus subi par les formes comme -algie et algie (< -algie), -ase et ase (< -ase). Des formes libres proviennent également de l’abrégement de mots pleins : auto (< automobile), télé (< télévision); elles vivent en parallèle avec les formants qui ont servi à créer les mots souches : auto- + mobileautomobile, télé- + visiontélévision. Leur statut respectif est donc différent : auto- n’est pas libre tandis que auto l’est. Leur sens varie également. Ces espèces d’homonymes ont normalement des entrées distinctes dans les dictionnaires.

Le procédé inverse existe aussi, car des lexèmes sont passés du statut de mot à l’état d’affixes, sans perdre pour autant leur statut de morphèmes libres. On les dénomme généralement affixoïdes. C’est le cas de bénéfice et de -bénéfice au Québec (voir le DQA). D’autres éléments comme -butoir, -cadre, -clé, -pilote, -zéro sont dans le même cas. Leur rôle est d’aider l’utilisateur à mieux décoder des mots qui, tout en étant construits à l’aide de ces éléments, ne seraient pas inscrits à la nomenclature d’un dictionnaire (voir les nombreux exemples en anti- et en co- pour les préfixes, en -able et en -ement pour les suffixes). C’est pour cette raison que l’on trouve souvent des exemples de construction dans ces articles (voir les huit exemples de -bénéfice dans le DQA : brunch-bénéfice, course-bénéfice, dîner-bénéfice, gala-bénéfice, repas-bénéfice, soirée-bénéfice, souper-bénéfice, spectacle-bénéfice). Ils permettent aussi à l’usager de les réemployer dans des mots nouveaux qu’il peut créer lui-même : *concert-bénéfice, *match-bénéfice.

Les inframots sont en nombre suffisant pour qu’on les considère comme une classe nomenclaturelle. Les préfixes et les formants savants dominent largement ce groupe qui ne comprend pratiquement pas de suffixes. La tendance est à les ranger dans de petits dictionnaires relégués dans les annexes comme le font le NPR et le DQA. Par ailleurs, la sélection des morphèmes n’est pas systématique (voir Boulanger 1995).

Enfin, des créations parallèles se produisent régulièrement : thèque et thymie, unités libres, et -thèque et -thymie, éléments de formation, proviennent du grec thêkê pour le premier couple (thèque, -thèque) et du grec thumos pour le second (thymie et -thymie).

4.1.2. Les mots graphiques

Les mots graphiques sont les vocables dans lesquels les lettres se succèdent sans interruption ou sont unies par des signes diacritiques. Ils constituent les unités libres traditionnelles. Ils appartiennent à plusieurs groupes : les mots simples monomorphématiques (NPR → femme, lit, voyage) ou multimorphématiques (NPR → avoirdupoids, gendarme, pourboire), les mots composés (NPR → dame-d’onze-heures, perce-neige, pH-mètre, sauve-qui-peut, sot-l’y-laisse, sterno-cléido-mastoïdien, suivez-moi-jeune-homme, tout-à-l’égout; presqu’île; PLI 1997 → prince-de-galles), les mots confixés (NPR → audiologie, francophonie, paléographie), les sigles et les acronymes (DQA → P.V.C., V.H.S.; cégep, sida), etc. Les mots à la physionomie ordinaire, parce qu’ils sont reconnus comme tels par tous, sont les plus nombreux à figurer dans les nomenclatures générales. Même si elles n’ont pas de signifié au sens strict, les lettres de l’alphabet sont considérées comme des mots pleins (NPR → a, b, c...). On ne distinguera pas ici entre les mots de la langue générale et les termes des LSP. On classera temporairement dans cette catégorie les unités alphanumériques —formes hybrides : lettres + chiffres— comme V1, V2 qui ont le statut d’entrée dans le NPR et dans le PLI 1997. Des unités comme 5 à 7, 4 x 4, K7 ne jouissent cependant pas de la même reconnaissance (voir plus loin). Les noms de nombres en chiffres sont des symboles, pas des morphèmes. Les adresses comme V1 et V2 s’écartent donc du modèle standard du mot écrit.

4.1.3. Les supramots

Les entrées supralexicales (les supramots) sont les unités disjointes et graphiquement complexes associées à un seul signifié et qui se déroulent sans rupture dans l’ordre séquentiel des composants (NPR → bon enfant, fausse couche, je ne sais quoi, osso buco, point de vue, prince de galles, repris de justice, sainte nitouche, traveller’s chèque) ou qui offrent une inversion de l’ordre naturel des composants (NPR → frise (cheval de), Javel (eau de); PLI 1997 → Kahler (maladie de), Kaposi (sarcome ou syndrome de), Péritel (prise); PR 1967 → Selz (eau de)). Ces unités sont particulièrement représentatives des LSP, mais leur nombre est aussi considérable dans les DGM (voir Boulanger 1989a et 1989b). Elles appartiennent au groupe des unités lexicales complexes, dites aussi composés dans la terminologie des linguistes français.

Dans un second groupe d’éléments supralexicaux, on intégrera les expressions et les locutions qui suivent l’ordre naturel des composants comme anch’io son pittore, e finita la commedia, ex cathedra, manu militari, parce que, sine qua non, sui generis qu’on trouve dans le GRLF et celles dont des éléments sont inversés comme sauvette (à la), six-quatre-deux (à la). Les constructions sans inversion sont souvent d’origine étrangère.

4.1.4. Les unités non lexicales

Les entrées dites non lexicales se répartissent dans diverses sous-catégories :

Les lemmes (adresses) comme ASA, DIN, ISO sont ni plus ni moins que des formations hybrides. Le NPR les lexicalise tout en restreignant leur usage au domaine de la photographie. En réalité, comme le montre leur étymologie, il s’agit aussi de noms propres devenus des marques déposées, sinon des quasi-noms communs.

4.1.5. Les unités grammaticales

Certaines formes fléchies de nature verbale comme les participes passés (NPR → eu/eue) ou de la nature du genre et/ou du nombre (NPR → au, aux, la, les, nos) perturbent parfois les nomenclatures. Ces entrées sont du type renvoi; les articles ne sont généralement pas développés. Il faut aller voir ailleurs dans le dictionnaire pour retrouver la forme neutralisée qui sert d’entrée. Comparer avec du et des qui ont des articles complets dans le NPR.

5. La nature des entrées

L’unité lexicographique n’est donc pas toujours le mot défini dans son sens strict d’unité du lexique et/ou de la grammaire, tant s’en faut. Ni dans son sens d’unité linguistique. Les symboles et les chiffres sont des signes sémiotiques. Un amalgame de types d’unités apparaît régulièrement à la nomenclature de tous les DGM, avec des pointes, selon la vocation du répertoire. De fait, l’entrée vogue entre la simple lettre (voir y qui a quatre entrées homonymes dans le NPR) et la séquence transphrastique (voir avoirdupoids, belle-d’onze-heures, garde-à-vous, je ne sais quoi, portefeuille, presqu’île, suivez-moi-jeune-homme, tout-à-l’égout), en faisant un détour vers l’univers du nom propre (voir Mach 1 et Mach 2 dans le NPR sous mach; Pompadour et 2. Têt dans le PLI 1997; Nobel et Québec dans le DQA), vers les unités alphanumériques (V1 et V2 dans le NPR et le PLI) et vers la galaxie des symboles (voir Ch, ph (cp. avec Ph) dans le NPR; Cf, ch, tep dans le PLI 1997).

On ramènera tout cela à trois cas de figure : les mots sémantiques (les morphèmes libres et les unités libres), les morphèmes grammaticaux libres (les mots outils : adverbes, prépositions, conjonctions, relatifs, déterminants, pronoms...) et les unités fragmentaires qui sont porteuses de sens et constituants de mots (les morphèmes grammaticaux liés : préfixes, suffixes, confixes, formants divers). Les morphèmes lexicaux liés comme port-, suer- ou tabl- ne font jamais partie des nomenclatures des DGM, excepté dans des dictionnaires du type linguistique comme le Robert méthodique. La courte typologie précédente laisse quand même voir que les unités qui composent le catalogue nomenclaturel d’un DGM sont, pour leur majorité, des suites ininterrompues de lettres liées entre elles ou rattachées par des signes non littéraux. L’appareil diacritique permettant de configurer les entrées composées est riche : le trait d’union (haut-le-cœur), l’apostrophe (aujourd’hui), le trait oblique (et/ou), le tiret (auto-, -eur), l’association de plusieurs signes (bernard-l’hermite, c’est-à-dire, sot-l’y-laisse), etc. Cette image traditionnelle correspond bien au mot graphique qu’on définit dans les grammaires, sauf pour les morphèmes liés. Ces mots sont beaucoup moins nombreux que les signes simples. Ce classement est strictement fondé sur l’image formelle, sur le signifiant détaché de son signifié. Car c’est d’abord par la forme que l’on interroge le dictionnaire et qu’on peut ensuite accéder à l’information recherchée. Les catégories des mots graphiques et des supramots obéissent à une convention en ce qui a trait à la géométrie de la forme lexicale qui servira de vedette. Cette figure traditionnelle est « celle du mot défini par le critère graphique de la séparabilité dans l’énoncé; cela suppose un système de signification idéal selon lequel à l’unicité morphologique du mot correspondrait l’unicité du concept » (Guilbert 1969 : 7).

L’instabilité graphique est également prise en compte par les dictionnaires :

Sur le plan méthodologique (macrostructure), le lexicographe privilégiera comme entrée les séquences non interrompues par un blanc typographique, à savoir les unités non segmentées. Ce protocole est conforme à la conception usuelle et traditionnelle du mot qui ayant horreur du vide conduit les lexicographes à préférer les composés dont les éléments sont soudés. La coalescence des composants est en outre un baromètre de lexicalisation. On peut aussi déceler dans ces choix des intentions normatives pour stabiliser les graphies.

Il arrive parfois que la forme complexe précède la variante comportant des signes diacritiques (NPR → je ne sais quoi/je-ne-sais-quoi). Le degré de lexicalisation en est la cause : fréquence, figement sémantique, etc.

6. Le lexique : du lexicologique au lexicographique

L’une des règles de la métalangue, de la grammaire et de la rhétorique protocolaires de la description lexicographique, est de fournir pour chaque adresse la partie du discours —la catégorie lexicale— ainsi que les flexions —la catégorie grammaticale—, le cas échéant. Il semble donc « qu’il n’y ait pas de mot sans catégorie grammaticale » (Rey-Debove 1971 : 121). Il en va ainsi en lexicologie et en grammaire. Or plusieurs sortes d’entrées non accompagnées de leur catégorisation lexico-grammaticale apparaissent dans les DGM. Ce sont les morphèmes liés (pomo-), certains noms propres (lieux, personnes... (parfois, on mentionne que ce sont des proprionymes : NPR → Mach; DQA → Québec)), certaines marques déposées, les symboles chimiques ou autres (NPR → 2. c, sens 7 et 8; PLI 1997 → tep), certains sigles (NPR → C.D.D., V.R.P.). Si elles ne font pas partie du lexique commun parce qu’elles ne revendiquent pas le statut de mots, ces unités font néanmoins partie du lexique dictionnairique. Celui-ci est donc qualitativement plus accueillant, plus souple que le lexique général, alors même qu’il est quantitativement plus réduit (voir le tableau 4).

Tableau 4 : Deux visions du lexique.
Tableau qui présente visuellement les différences entre la conception du lexique en lexicologie et en lexicographie.

Autrement dit, la conception lexicographique du mot est plus large, plus ouverte que sa conception lexicologique, tandis que la conception du lexique est plus large, plus ouverte en lexicologie qu’en lexicographie. L’équation qui stipule que mots du dictionnaire égale mots du lexique est fausse, l’inverse étant également une proposition fausse. Ainsi, les néologismes font partie du lexique dès leur naissance, mais ils peuvent attendre des années avant d’être répertoriés dans les dictionnaires, s’ils le sont jamais. Les nomenclatures ne rendent compte que des mots largement attestés, c’est-à-dire socialement reçus. Dans un dictionnaire est donc dessinée « une image nécessairement restreinte du lexique, toujours en décalage par rapport au potentiel de la langue » (Collinot et Mazière 1997 : 54). D’où les diffractions entre le mot du lexique et le mot du dictionnaire ou le mot lexicographique. Tout mot-entrée qui apparaît au dictionnaire n’est donc pas nécessairement un mot du lexique et tout mot du lexique n’est pas nécessairement un mot dictionnairique. D’où la confusion sur le statut normatif des mots du dictionnaire et l’idée que se font certains utilisateurs que ce qui ne paraît pas au dictionnaire n’est pas un mot et que ce qui est consigné dans le dictionnaire est un mot accepté.

Si l’on excepte les catégories citées au paragraphe précédent, et que l’on revient au lexique perçu usuellement, la structure nomenclaturelle naturelle, celle du mot simple, comportant ou non des signes diacritiques, est disloquée dans deux cas : par les morphèmes liés et par les unités lexicales complexes. La graphie et le statut de mot à part entière conditionnent donc l’entrée de la majorité des mots dans un dictionnaire. Mais en retenant les morphèmes liés, le lexicographe transgresse des règles, il déstructure la macro- et la microstructures pour la bonne raison que le fragment morphémique n’est pas associé naturellement à une partie du discours signalée par la catégorisation lexico-grammaticale. Il n’est pas non plus hiérarchisable dans une famille morphologique ou dans un complexe onomasiologique sauf à dire que les morphèmes sémantiquement apparentés construisent des séries oppositives ou graduantes (macro-/micro-, uni-/bi-/tri-/quadri-, etc.). L’intérêt des séries gréco-latines pour répondre à des besoins néologiques actuels dans les LSP, plus spécifiquement dans les sciences, est manifeste. Leur utilisation à des fins taxinomiques est fonctionnelle sur le plan paradigmatique (-ite pour les noms de minéraux (labradorite), -ose pour les noms de maladies non inflammatoires (arthrose, scoliose)). « Les bases ne sont plus en fait gréco-latines, mais possèdent un statut classificatoire qui ne se fait plus en référence à [la] langue-source : dans ce cas, la base grecque ou latine indique souvent un taxon et les préfixes gréco-latins, totalement conventionnalisés, les variétés du taxon : on trouve alors des séries du type di-, ortho-, méta-, para-chlorobenzène » (Gaudin 1993 : 135). Dans une telle série, la base devient le générique, les affixes servant de caractères de spécification (= les différences spécifiques).

Voilà donc les quelques réflexions que le mirage du mot peut inspirer. Ce rapport d’opposition établi entre lexique, macrostructure, nomenclature et entrée vaut bien entendu pour le français. Il est historique puisqu’il trouve sa source à la Renaissance. Depuis, la méthode fondamentale d’élaboration des dictionnaires n’a guère changé. De Robert Estienne aux dictionnaires d’aujourd’hui, le mot du dictionnaire a toujours emprunté ses caractéristiques tantôt au lexique, tantôt à d’autres communautés de signes linguistiques ou non linguistiques.

Bibliographie

Linguistique

Dictionnaires

Barcelona, 23 de febrer de 1998

Note

[1] Aquesta conferència va ser realitzada durant l’estada que el professor Jean-Claude Boulanger va realitzar a l’IULA com a professor visitant, amb l’ajut per al finançament de l’estada per part del Ministeri d’Educació i Cultura (ref. núm. SAB95-0532).

Référence bibliographique

BOULANGER, Jean-Claude (2000). « La nature et le dessin des mots dans les dictionnaires de langue », dans Lèxic, corpus i diccionaris, Barcelona, Institut universitari de lingüística aplicada, Universitat Pompeu Fabra, coll. « Cicle de confèrencies i seminaris », no 97-98, p. 73-94. [article]

Resum (catalan)

La unitat fonamental de la lexicografia no es correspon sempre amb la unitat lèxica, ni tan sols amb la unitat lingüística, perquè la unitat pròpia de la lexicografia està sotmesa a les restriccions que comporten la macroestructura, la nomenclatura i les mateixes entrades del diccionari. A partir d’aquesta constatació, el professor Boulanger se centra en la descripció de la diversitat de formes que pot presentar la unitat lexicogràfica i quins tractaments hauria de rebre en el diccionari en cada cas, des dels anomenats inframots —afixos, afixoides— fins als noms propis, sigles, marques registrades o símbols.