Le syntagme en informatique un projet de recherche

Dans le cadre de l’entente conclue entre l’Université Laval et la société IBM Canada, et en collaboration avec une collègue du Département de langues et linguistique, l’auteur de cet article dirige un projet de recherche qui porte sur la syntagmatique terminologique en français et en anglais dans le domaine de l’informatique. Le projet comprend deux volets : le premier consiste en l’élaboration d’une bibliographie linguistique analytique sur le phénomène du syntagme en terminologie; le second porte sur une recherche théorique et appliquée sur le même phénomène.

La constitution d’une bibliographie sur le syntagme

La terminologie ne dispose pas encore de tout l’appareillage méthodologique et théorique requis pour la conduite d’études précises dans certaines de ses régions inconnues ou encore obscures. La syntagmatique est l’une d’elles. À peine explorée et en raison de l’absence d’outils d’analyse, elle laisse maintes questions sans réponse. C’est pourquoi a été entrepris l’établissement d’une bibliographie linguistique analytique portant sur les textes traitant de la syntagmatique française et anglaise au cours des vingt dernières années, période qui commence avec les premiers écrits de Louis Guilbert sur le sujet, notamment dans sa thèse sur la formation du vocabulaire de l’aviation.

Les documents dépouillés (articles, livres, thèses, actes de rencontres scientifiques, etc.) peuvent être rédigés en français, en anglais ou dans une autre langue, du moment qu’il y est question du syntagme français ou anglais. La recherche nécessite la mise au point d’une liste de descripteurs propres au sous-secteur de la terminologie qu’est la syntagmatique générale ou comparée.

Cette partie du projet est réalisée à l’aide du logiciel BIBELO. Celui-ci est utilisé par le Centre international de recherche sur le bilinguisme pour l’établissement d’une bibliographie informatisée sur le bilinguisme et l’enseignement des langues officielles, d’où l’acronyme BIBELO. Deux étudiants sont associés à la recherche dont les premiers résultats seront publiés dans les mois à venir. A l’heure actuelle, une centaine de titres sont résumés tandis que le recensement et l’uniformisation des descripteurs s’achèvent.

La recherche théorique et appliquée sur le syntagme

On sait que le terme syntagme est polysémique (homonymique?) en linguistique et qu’il est pourvu d’une myriade de synonymes hérités d’écoles de pensée diverses, de chercheurs isolés, dispersés dans l’espace comme dans le temps. Du syntagme saussurien en passant par le syntagme chomskyen, nous sommes arrivés à la fin des années 60 au syntagme terminologique wustérien, vite réduit au terme syntagme tout court. Par ailleurs, on a recensé jusqu’à présent plusieurs dizaines de synonymes servant à désigner la notion de « syntagme », spécialement R. Kocourek qui s’est arrêté à vingt-sept dénominations sémantiquement équivalentes, en tout ou en partie, dans une étude bien connue. Il n’en demeure pas moins que malgré sa polysémie / homonymie et sa synonymie « inflationnelle », le terme syntagme est l’objet d’un large consensus dans la communauté scientifique. Tous savent le reconnaître et tous s’entendent sur la signification précise qu’il recouvre, à savoir : « groupe d’unités linguistiques syntaxiquement liées et qui fonctionnent comme une unité simple, c’est-à-dire qui sert à dénommer une seule notion, une seule réalité dans un domaine donné du savoir humain ».

Incontestablement, le syntagme est au cœur de la terminologie. Rares sont les linguistes qui l’ont examiné en profondeur. Quelques-uns, comme Benveniste (synapsie), Martinet (synthème) et Guilbert (syntagme et dérivation syntagmatique), ont senti son emprise sur la langue. Mais à l’exception du dernier, presque tous ont cantonné son étude à la langue générale, ce qui a retardé l’éclosion et la fixation de frontières précises pour ce concept en terminologie. À ce jour, il n’existe aucune recherche scientifique poussée sur les unités terminologiques complexes aux fins d’en cerner les principes théoriques et les applications pratiques dans des perspectives d’aide à la traduction et à la recherche terminographique, sans compter les incidences sur la lexicographie de la langue générale et sur les banques de terminologie. Outre les travaux de Guilbert, la seule tentative d’importance fut la Table ronde sur le découpage du terme tenue en 1978 à Montréal et dont les actes furent publiés par l’Office de la langue française en 1979.

L’analyse systématique du syntagme dans le domaine de l’informatique propose de combler en partie ces lacunes criantes.

Le projet cherchera à établir une typologie renouvelée et révisée des syntagmes pour chaque langue (l’anglais et le français). De fait, si le français possède déjà quelques pistes, il n’en va pas de même pour l’anglais pour qui le déficit est plus visible. L’étude des structures et des modes de formation des syntagmes ainsi que le démontage des mécanismes du fonctionnement syntaxique sont prévus pour chacune des langues. Puis, une analyse comparative entre les différents types français et anglais est envisagée dans une perspective nettement traductionnelle.

L’étude devrait permettre de scruter quelques problèmes spécifiques à la terminologie de l’informatique : modes de création néologique privilégiés dans ce domaine, niveaux de langue socioprofessionnels, emprunts, sigles et acronymes, marques déposées, éponymes, termes mal construits, variation linguistique, synonymie, terminologisation (c’est-à-dire installation du terme dans l’usage), signification des joncteurs syntaxiques (notamment le rôle des prépositions et des autres catégories de joncteurs), difficultés de traduction, etc., et cela tant dans la langue de Molière que dans la langue de Shakespeare.

La recherche est menée à partir de la nomenclature extraite de la banque de terminologie de la société IBM Canada, connue sous l’appellation IBMOT. Le projet n’a pas comme objectif de construire une terminologie parallèle à celles qui existent déjà et qui sont disponibles sous la forme de dictionnaires terminologiques traditionnels ou encore sous la forme de dictionnaires informatisés, comme la Banque de terminologie du Québec (BTQ), la Banque de terminologie du Canada (TERMIUM) ou celle de la Communauté économique européenne (EURODICAUTOM). Le corpus IBMOT est déjà emmagasiné sur support informatique et son degré de qualité et de fiabilité est reconnu par les spécialistes du domaine de l’informatique. La recherche aborde de plain-pied la terminologie existante répertoriée dans la minibanque.

Nous en sommes présentement à la sélection du meilleur logiciel pour le traitement des données. Il est fort probable que nous recourrons au logiciel DBaseIII+. Des essais sont tentés à l’aide d’un minicorpus d’un millier d’unités. Les premiers résultats obtenus sont satisfaisants.

Comme on décortique une formule chimique, nous autopsions le syntagme afin d’en décoder et d’en dégager les mécanismes de construction et de fonctionnement. Les retombées escomptées de ce projet de recherche devraient d’abord favoriser la rationalisation de l’utilisation de la terminologie de l’informatique pour quelque usage que ce soit : préparation de logiciels, de manuels, de programmes, etc. À partir des points de vue linguistique et traductionnel, le projet proposera des modèles de création de termes et des grilles comparatives qui permettront de découper, traiter, interpréter et analyser les syntagmes et ses constituants avec beaucoup plus d’efficacité qu’auparavant; il fixera une typologie ramenée à des structures de base simples; il fournira des indices sur la variation linguistique géographique et des informations sur les diverses interférences entre les unités terminologiques intra- ou translinguistiques.

Bibliographie

La place du syntagme dans le dictionnaire de langue

... a term should be as short as possible and not longer than necessary ... (Sager, 1979, p. 52)

1. Introduction

L’objet de cette communication consiste à examiner la place du syntagme, et plus spécifiquement du syntagme terminologique (ST), dans les dictionnaires de langue ou mieux dans les dictionnaires généraux monolingues (DGM). Le syntagme sera ici défini comme étant « un groupe de mots séparés par des blancs et qui sont syntaxiquement liés tout en identifiant une notion unique dans un domaine déterminé du savoir » (Boulanger, 1988a : 2). Le syntagme est donc une suite de signifiants discontinus empmntant la physionomie d’une séquence syntaxique à combinaisons variables suivant les groupes de mots et à signifié unique et constant. La dénomination syntagme recouvre les synonymes proposés par d’autres linguistes : c’est la lexie complexe de Pottier, la synapsie de Benveniste, le synthème de Martinet, l’unité phraséologique de Dubois, l’unité syntagmatique de Guilbert, etc. (Kocourek, 1982 : 117; Boulanger/Nakos, 1988). La forme composée apparaît aussi fréquemment dans la littérature scientifique européenne. Ce dernier terme n’est cependant que partiellement synonyme de syntagme. L’un comme l’autre relèvent par ailleurs de la polysémie; ce qui ne réjouit guère les terminologues préoccupés par l’équation : un terme ↔ un concept. Dans la suite de l’exposé, j’utiliserai le terme syntagme et quelques autres variantes comme terme complexe, forme complexe, etc.

La langue, dans ses dimensions générale et spécialisée, propose aux locuteurs des masses d’unités complexes qu’il faut mémoriser et maîtriser à l’égal des formes simples, des locutions, des proverbes et des autres constructions qui font appel à des séquences de mots disjoints; point de vue, bon vivant, accident de parcours, violon d’Ingres sont aussi sémantiquement monolithiques que tourner au vinaigre, à visage découvert, de vieille souche, jamais de la vie ou Quand le diable devient vieux, il se fait ermite (« il est facile de renoncer au plaisir quand on ne peut plus le goûter » (PR). Une proportion considérable de mots complexes pénètrent dans les DGM. Alain Rey estime qu’un répertoire de 80 000 entrées, comme le GRLF, abrite quelque 500 000 ST dans le corps des articles (Rey, 1985a : XXIV, n. 6). L’évaluation toute intuitive du lexicographe robertien n’inclut pas les syntagmes qui appartiennent à la langue générale. Leur nombre est sans nul doute fort élevé.

Comme j’ai déjà abordé ailleurs la question du statut du syntagme dans la macrostructure des DGM (voir Boulanger, 1988a), la présente incursion balisera la microstructure, c’est-à-dire le « programme systématique de présentation et de traitement des unités » (Rey, 1977 : V-31). Avant d’entrer dans le vif du sujet, il convient de réanimer deux idées :

1. Une recherche rapide et partielle au sujet des différentes catégories d’entrées dans cinq dictionnaires de langue récents montre que le syntagme occupe environ 1% de la nomenclature totale (Boulanger, 1988a : tableaux 3 et 4). « Ce type de formations composées [les syntagmes] n’était pas reconnu dans la lexicographie traditionnelle; celles-ci étaient recensées à l’intérieur des articles comme séquences phraséologiques servant d’exemples à l’appui du classement sémantique. La linguistique moderne a dégagé la spécificité de ces formations sans parvenir encore à bouleverser la présentation des dictionnaires » (Guilbert, 1971 : LXVII). À titre d’exemple, le mot homme, prolifique sur le plan syntagmatique, n’a pas droit à une seule entrée sous l’une ou l’autre de ses apparences complexes dans le PLI89 et le MR88. Les articles s’étendent sur deux-tiers de colonne; ils recèlent respectivement douze et 23 syntagmes construits à l’aide du mot homme dans le rôle de la base ou de l’expansion. Au total, on recense 29 formes différentes (les formes communes portent l’astérique dans le tableau 1). Le signe moins placé entre crochets [-] signale que le syntagme est répertorié dans le dictionnaire sous l’autre composante. Trois unités du GRLF se retrouvent ailleurs (grand homme, homme de main et homme de troupe) tandis que huit unités du PLI subissent le même sort (homme de bien, homme de génie, homme de la rue, homme de lettres, homme de peine, jeune homme, vieil homme (sous vieux) et voix d’homme). Aucune des formes en question n’est commune aux deux dictionnaires. Afin de compléter le carrousel, il resterait à vérifier les syntagmes qui ont les honneurs des articles consacrés à chaque élément autonome qui les compose. Cette recherche est en cours.

Tableau 1 : Le syntagme homme dans le PLI89 et le MR88
homme GRLF PLI *
~ à femmes + -
~ d’action + + *
~ d’affaires + + *
~ de bien + [-]
~ de Cro-Magnon - +
~ de génie + [-]
~ de la rue + [-]
~ de lettres + [-]
~ de loi + + *
~ de main [-] +
~ de peine + [-]
~ de science + -
~ d’État + + *
~ de troupe [-] +
~ du jour + -
~ du monde + + *
~ du peuple + -
~ du rang - +
~ marié + -
âge d’~ + -
droits de l’~ + -
Fils de l’~ + + *
grand ~ [-] +
jeune ~ + [-]
parole d’~ + -
premier ~ - +
vêtement d’~ + -
vieil ~ + [-]
voix d’~ + [-]
29 23 12 6

2. Le syntagme constitue la caractéristique dominante en terminologie. Les statistiques compilées à propos de différents corpus montrent que le pourcentage moyen de ST pivote autour de 80% de la masse des termes répertoriés dans une sphère de la connaissance (voir Boulanger, 1988a, tableaux 1 et 2). Aucune statistique n’est disponible en ce qui concerne la proportion de syntagmes en langue générale.

2. Autopsie du syntagme

Un volume assez considérable de formes complexes passe dans les DGM. Le lexicographe doit donc définir des modalités d’intégration et de traitement qui puissent correspondre à son programme dictionnairique et satisfaire le public consulteur. En lexicographie française, la tradition veut qu’on n’accorde pas spontanément le statut d’entrée à tous les syntagmes, généraux comme spécialisés. Ces formes libres unies par un contenu sémantique et une liaison syntaxique qui caractérisent leur fusion n’ont pas fait l’objet de « critères de délimitation entre celles qui accèdent au statut d’entrée et celles qui en sont écartées » (Guilbert/Lagane/Niobey, 1971 : III). S’ils existent, ces critères sont pour le moins imprécis ou ils ne sont jamais évoqués dans les discours prélexicographiques. L’un des critères avancés est la prédominance de la forme simple ou continue du mot sur le sens. « La définition des unités composées, en effet, n’est pas fixée d’une manière indiscutable. La lexicologie traditionnelle reconnaît comme mots composés ceux dont les termes constituants peuvent être soit soudés (portefeuille), soit unis par la marque graphique du trait d’union; ils sont recensés à leur ordre alphabétique comme unités indépendantes. Les unités formées de plusieurs éléments lexicaux autonomes [...] sont recensées sous l’adresse du premier terme constituant. À peine une évolution récente, dont ce dictionnaire [le GLLF] s’est fait l’écho, amène-t-elle à considérer chemin de fer et pomme de terre comme des entrées séparées » (Guilbert, 1971 : IX).

Ainsi si l’on convient qu’un grand nombre de syntagmes sont élaborés à l’aide d’unités générales autonomes en langue, c’est-à-dire qu’elles fonctionnent aussi comme des mots individualisés déjà disponibles dans le fonds commun du lexique, ou virtuelles en raison de leur caractère néologique, et, le plus souvent polysémique du point de vue lexicographique, on considérera leur association comme normale et réalisable par le locuteur au gré de ses besoins discursifs et selon les mêmes mécanismes de formation auxquels il recourt pour créer des unités simples. Cette conception entraîne que chaque segment du dérivé syntagmatique peut être répertorié à sa place alphabétique dans le dictionnaire de langue. La refragmentation du terme complexe en ses parties constituantes élimine le plus souvent les joncteurs syntaxiques qui jouent pourtant un rôle fondamental en tant que courroie de transmission lors de l’établissement du sens du syntagme. Cette fonction est aussi primordiale que le contexte situationnel extralinguistique. À titre d’exemple, dans le Vocabulaire des papiers et cartons (Côte, 1983), il y a 108 ST dérivés de la base carton. Les expansions utilisent un total de 112 constituants différents auxquels s’additionnent 5 joncteurs produisant 63 occurrences syntagmatiques (à [au] avec 35 apparitions, de [de la, de l’] avec 17 apparitions, pour, avec neuf apparitions, sur et une avec une attestation chacun). Par expansion il faut entendre aussi bien une forme libre comme jute, contrecollé ou bloc-notes qu’un morphème lié comme mi-, mono(-) ou simili(-) qui ont été détachés de leur élément lexical dans le corpus étudié ici. Le GRLF enregistre la totalité des formes en entrées indépendantes tandis que le PLI en retient 99. Aucun mot n’est rejeté par les deux dictionnaires. La liste alphabétique de toutes les unités et des éléments de formation est dressée dans l’annexe. Elles sont accompagnées de la catégorisation lexicale (67 noms, 39 adjectifs, deux verbes, quatre préfixes) et de l’indicatif de fréquence. Les joncteurs n’apparaissent pas dans la liste tandis que les expansions elles-mêmes syntagmatiques ont été fragmentées et comptées comme des mots simples (ex. : boîte d’allumettes > boîte et allumette; carte postale > carte et postal). Les composés soudés ou unis par le trait d’union sont restés intacts (ex. : contre-collé, bloc-notes); Les dérivés à préfixes liés ont été décomposés (ex. : monocouche > mono-, couche; simili-chêne > simili-, chêne). Enfin, la forme canonique a été rétablie (ex. cartes > carte; perforée > perforé). La réunion des formes simples en agrégat syntagmatique n’est cependant pas toujours prévisible et elle pose des problèmes au plan sémantique, difficultés que les consulteurs de dictionnaires souhaitent justement voir résolues dans leur outil de référence préféré. Si carton blanc, carton à calendrier et carton ondulé se décodent aisément à partir des sens premiers des éléments, il n’en va pas de même de tous les assemblages, tant s’en faut. Que déduire de carton fossile (« Carton composé de fibres d’amiante uniquement ou de fibres d’amiante mélangées avec des liants ou charges, utilisé comme isolant thermique et électrique en raison de son haut degré d’incombustibilité » (Côte, 1983 : 13), de carton à crachoir (« Carton imperméable, le plus souvent ciré, servant à fabriquer les gobelets que l’on place dans les petits crachoirs utilisés dans les hôpitaux et que l’on jette après usage » (Côte, 1983 : 54)) et de carton diélectrique (« Carton dur et dense servant d’isolant électrique » (Côte, 1983 : 29)? Les sens de ces syntagmes sont loin de se laisser deviner de la simple projection faite à l’aide des informations sémantiques recueillies dans les DGM pour chacun des exemples cités.

3. De la macrostructure à la microstructure

S’il est souhaitable d’améliorer le statut du syntagme dans les DGM, c’est sûrement au sein de la microstructure que les hésitations sont les plus perceptibles et que les règles sont les plus difficiles à structurer.

Une spectroscopie de l’article de dictionnaire révèle rapidement que le syntagme peut loger dans presque toutes les rubriques microstructurales, à l’exception bien entendu de la prononciation et de la catégorisation lexico-grammaticale, quoiqu’on y trouve des traces indirectes parfois (voir MR : grand appartement : [ɡʀɑ̃tapaʀtəmɑ̃], sous grand et GRLF : 3. Pandore (boîte de) : loc. nominale). La sous-entrée, l’exemple construit ou littéraire et la définition sont les rubriques qui accueillent le plus fréquemment les contingents lexicaux sémantiquement figés.

À ce stade, il est également bon de rappeler que le syntagme n’est pas l’unique groupe de mots ayant un sens personnalisé, tout en étant syntaxiquement liés, qui figure dans les articles : les locutions, les proverbes, les phraséologismes, les constructions diverses sont également catalogués. Les deux premières catégories d’expressions sont souvent labellisées (voir l’origine de ce mot dans Boulanger, 1988b) à l’aide des abréviations loc. et prov., sort enviable qui est loin d’être réservé aux unités complexes. Voir par exemple l’article chèque dans le GRLF : Loc. fig. Donner un chèque en blanc à qqn.

Afin d’illustrer l’importance et les rôles du syntagme dans les DGM, j’ai choisi d’examiner l’article chèque dans le GRLF. Le texte occupe les deux-tiers d’une colonne. En ne comptabilisant pas les formules phraséologiques comme émettre un chèque et faire porter un chèque au crédit de son compte ainsi que la locution citée précédemment, on repère 32 dérivés complexes dûment « coalescencés » sémantiquement. (L’évaluation de leur degré de figement sémantique n’est redevable qu’à moi seul.) Parmi les 32 complexes lexicaux, 26 sont construits à l’aide du terme chèque, qui sert de base à vingt occasions et d’expansion déterminative à six reprises. Les six syntagmes restants font appel à d’autres termes que chèque (voir le tableau 2).

Les syntagmes ont également été classés dans une grille de modèles de base emprunté à Louis Guilbert (voir Guilbert, 1970). Un septième type, assimilé par Guilbert aux structures à bases nominales, a été ici considéré. Les raisons évoquées par le regretté linguiste pour fusionner les modèles à base verbale aux schémas nominaux ne résistent pas toutes à l’analyse, particulièrement dans les technolectes. Ils ne peuvent pas tous être nominalisés à partir de la forme passive du verbe qui fournit un substantif déverbal; ainsi la phrase ce qui fait que les fonds sont appelés se transforme en appel de fonds alors que la phrase ce qui fait que le versement est appelé, qui est aussi nominalisable, n’est pas nominalisée en *appel de versement dans le domaine bancaire; le groupe appeler un versement est privilégié par les utilisateurs. Il en va de même de ce qui fait que le rappel est sonné qui ne se transforme pas puisque dans ce cas, il n’existe pas de déverbal de sonner, ni de substitut qui ferait référence à « un radical différent de celui du verbe de base » (Guilbert, 1971 : LXVII; voir aussi l’analyse transformationnelle des locutions verbales avancée par l’auteur à la p. LXVIII).

La grille illustre la fréquence et le pourcentage pour chaque modèle (voir le tableau 3). Le numéro du schéma binaire est le même qui apparaît dans le tableau 2.

Des six modèles binaires guilbertiens, quatre sont représentés dans le minicorpus témoin tandis que deux sont absents. On en trouve cependant de nombreuses attestations ailleurs dans le GRLF : petit déjeuner* pour le modèle 5, permis* de conduire pour le

Tableau 2 : Les syntagmes dans l’article chèque du GRLF
Syntagme Modèle Structure
1. chèque + X
~ à ordre 1 s
~ au porteur 4 s
~ bancaire 2 s
~ barré 2 s
~ certifié 2 s
~ circulaire 2 s
~ de cavalerie 1 s
~ de complaisance 1 s
~ de retrait 1 s
~ de virement 1 s
~ de voyage 1 s
~ documentaire 2 s
~ en blanc 1 s
~ en bois 1 s
~ nominatif 2 s
~ postal 2 s
~ postal d’assignation 1 c
~ prébarré à l’impression 4 c
~ sans provision 1 s
~ visé 2 s
2. X + chèque(s)
carnet de ~s 1 s
formule de ~ 1 s
payer par ~ 7 s
versement par ~ 1 s
3. X + chèque(s) + X
bureau de chèques postaux 1 c
compte chèque postal 3 c
4. autres combinaisons
agent de change 1 s
barres parallèles 2 s
carte blanche 2 s
compte postal 2 s
dispositions légales 2 s
établissement financier 2 s

modèle 6. Enfin, les syntagmes simples (28/32 ou 87,5%) l’emportent largement sur les structures plus complexes (4/32 ou 12,5%), c’est-à-dire des syntagmes eux-mêmes dérivés de constructions bipolaires.

Dans le tableau 2, les lettres [S] et [C] identifient l’agencement primaire ou l’agencement plus développé.

Tableau 3 : Typologie des syntagmes : modèles binaires
Modèle Nombre Pourcentage
1. nom + joncteur + nom 15 ~47%
2. nom + adjectif 13 ~41%
3. nom + ∅ + nom 1 ~3%
4. nom + joncteur + prédéterminant + nom 2 ~6%
5. adjectif + nom 0 0%
6. nom + joncteur + verbe 0 0%
7. verbe + joncteur + nom 1 ~3%
32 100%

4. Place du syntagme dans l’article

Le minicorpus scruté montre que le syntagme peut prendre place dans différentes rubriques et sous-rubriques citées ci-dessous en ordre décroissant d’occurrences observées (voir aussi le tableau 4) :

Rubrique Précision Contenu
exemple exemple construit syntagme-exemple chèque bancaire, payer par chèque
segment phrastique Un carnet de chèques.
phrase nominale Des chèques de voyage en dollars, en yens.
contexte terminologique complet non référencé Les dispositions légales en vigueur ont répandu, depuis 1979, l’usage des chèques « prébarrés » à l’impression.
citation littéraire chèque en blanc, citation de Roger Garaudy pour le sens figuré
définition établissement financier, agent de change, bureau de chèques postaux
réseau analogique → Donner carte* blanche
sous-entrée chèque postal, chèque de voyage
locution Donner un chèque en blanc à qqn
indicatif de région (Au Canada). Chèque visé

Un même syntagme peut être retrouvé dans plus d’une rubrique car sa fonction peut changer. Chèque en blanc a été repéré dans un exemple lexicographique qui joue le rôle d’une sous-entrée suivie de sa définition et précédée de la date de première attestation (1953), dans une locution figurée et dans une citation littéraire. Outre ses trois occurrences, ce syntagme constitue à lui seul un sous-article au sein de l’article chèque. Il en va de même pour chèque de voyage pour lequel on fournit la date d’apparition (1953) et l’origine (de l’anglais traveller check).

Il est parfois fort difficile de distinguer la véritable sous-entrée, repérable grâce à l’information codée que recèle le recours aux petites majuscules (chèque postal), de la sous-entrée caméléon qui emprunte la couleur des italiques, indice habituel de l’exemple (chèque en blanc). En principe, le code lexicographique stipule que les jeux de caractères alternent suivant une procédure rigoureuse qui permet une identification rapide des rubriques et de l’information transmise.

En outre, certains syntagmes-exemples sont prolongés par une définition qui relaie l’équivalent sémantique complet. Cette définition reprend la base du syntagme comme genre prochain (chèque en blanc : « chèque que le tireur a signé sans indiquer la somme que le tiré devra payer ») tandis que d’autres n ’énumèrent que les différences spécifiques ou ils appartiennent au type de définition relationnelle (chèque certifié, « sur lequel le tiré certifie que la provision du tireur permet de payer le chèque »; chèque de virement et surtout chèque barré qui est suivi d’un segment définitionnel d’un haut degré technolectal). L’utilisation de la « demi-définition » est un choix méthodologique. Alain Rey l’explique comme étant « une sorte de glose [...] analysant un surplus de sens ajouté à ce qui vient d’être défini » (Rey, 1985a, p. XXXIV), c’est-à-dire à la base chèque.

Rubrique Précision Occurrences
exemple exemple construit syntagme-exemple 22
segment phrastique 1
phrase nominale 1
contexte terminologique complet 1
citation littéraire 1
définition 6
réseau analogique 5
sous-entrée 2
locution 1
indicatif de région 1

Trois syntagmes voient l’une de leurs composantes affublée d’un astérisque qui renvoie à l’autre élément consigné dans le dictionnaire (chèque en bois*, chèque sans provision*, chèque à ordre*). Sous bois, chèque en bois est défini : « chèque sans provision » et il n’y a pas de renvoi à chèque. Chèque sans provision est défini sous ce dernier terme. Malgré l’astérisque de réciprocité, l’article ordre ne récupère pas le syntagme chèque à ordre.

À l’inverse, des syntagmes non marqués à l’aide d’un astérisque se retrouvent aussi sous l’autre forme indépendante : chèque au porteur est inclus dans l’article porteur avec un renvoi à chèque; chèque bancaire apparaît sous bancaire avec l’indication : par opposition à chèque postal mais il n’y a pas de renvoi à chèque; chèque barré est sous 1. barrer sans renvoi réciproque; chèque de cavalerie est défini sous cavalerie sans renvoi à chèque; chèque de complaisance est défini sous le dernier élément sans renvoi; etc. On voit déjà poindre ici la nécessité d’intégrer davantage l’informatique à la démarche de rédaction des articles lexicographiques.

L’astérisque sert aussi à identifier le mot-pivot sous lequel trouver une information (carte* blanche dans la locution donner carte* blanche). Il peut enfin arriver que seul le contexte d’utilisation présente un syntagme dont il n’est pas fait mention ailleurs dans l’article (chèque prébarré à l’impression est révélé dans le contexte terminologique).

Un survol rapide de quelques articles montrent que le syntagme est présent en d’autres lieux de la microstructure :

5. Conclusion : y a-t-il un avenir pour le syntagme en lexicographie?

L’insertion du syntagme dans un DGM relève d’une décision à deux paliers :

1. Faut-il considérer le syntagme comme un objet lexicographique? 2. Si oui, prendra-t-il place dans la macrostructure ou dans la seule microstructure et quel traitement recevra-t-il? Dans l’article, il aura un statut de dépendance à l’égard d’un mot-pivot qui servira de fil d’Ariane pour accéder au complexe. Il pourra alors apparaître dans plusieurs rubriques. De nombreux syntagmes sont cependant traités sous chacune de leurs composantes lexicales, ce qui est loin d’être économique mais semble rendre pour le moment de précieux services aux consulteurs.

Indéniablement, le syntagme est un objet lexicographique. On le trouve en macro-et en microstructure. « Lorsque le syntagme est lexicalisé, le lexicographe se doit de le définir comme il définit l’entrée. Sans cette définition son statut reste quelconque » (Rey-Debove, 1971, p. 303). Plus encore, le processus de lexicalisation ne peut pas être dissocié de la cohésion sémantique, de la référence au contenu de la réalia ou de la notion dont les propriétés se définissent par opposition aux traits propres à d’autres unités. La présence de l’expansion déterminative est obligatoire et nécessaire pour exprimer les caractères sémantiques qui circonscrivent complètement l’objet et le hiérarchise par rapports à d’autres qui appartiennent à la même sphère notionnelle (voir Guilbert, 1971, p. LXIX). Il est clair cependant qu’en lexicographie générale, le réseau notionel dégagé n’a pas le même objectif classificatoire qu’en terminographie. Le DGM décrit le fonctionnement des unités de la langue; ce n’est qu’accessoirement qu’il réfère aux classes d’objets de l’univers (voir Rey, 1985b).

De plus, le lexicographe a besoin du syntagme pour élaborer ses énoncés lexicographiques (définition, remarques, interventions diverses, etc.). Le dictionnariste est aussi un écrivain, un manieur de mots qui puise au même réservoir que tous ceux qui écrivent et rédigent. Ainsi dans l’article cheval du MR, on retrace les syntagmes animal de trait, animal de transport, race pure, santé de fer, unité de travail, viande de cheval et course à cheval, tous utilisés pour discourir sur le mot cheval qui est le sujet de l’article. La présence des formations complexes dans les dictionnaires n’est pas une lubie, ni une fantaisie. Elles sont plus que des objets linguistiques à décrire se présentant au lexicographe selon des formules variées. Elles sont elles-mêmes des éléments-clés de l’appareil de description et du discours lexicographiques. Tous les rédacteurs de dictionnaires en conviennent. Mais pour le moment leurs constats s’arrêtent au palier métalinguistique dont les règles sont dictées par la lexicologie traditionnelle. La prise en compte de plus en plus évidente de l’aspect sémantique forcera les lexicographes à franchir la frontière du mot graphique pour octroyer au syntagme la juste place qui lui revient dans les dictionnaires de la langue française, renforcissant ainsi les intelligences avec la terminographie.

6. IDLL et artisanat lexicographique

Les lexicographes façonnent des dictionnaires, c’est-à-dire des instruments du savoir, des produits qui véhiculent la langue et transmettent la vision du monde que se forge chaque communauté linguistique. Les dictionnaires renferment donc en filigrane des mots l’histoire des civilisations, tant dans les dimensions du permis que dans celles de l’interdit (voir Boulanger, 1986). Depuis des siècles, les dictionnaristes œuvrent artisanalement. Longtemps avant la forte poussée expansionniste de l’informatique et de ses outils logiciels, les dictionnaires imprimés constituaient à leur manière une industrie de la langue, de la culture et de la connaissance dont le poids n’était pas négligeable dans l’économie des sociétés européennes. « Terminologie et lexicographie sont des outils de développement de la langue et peuvent, à ce titre, être classées parmi les activités et les produits des industries de la langue » (Auger, 1988 p. 12). Il paraît opportun de tenir compte d’une manière un peu plus affirmée du sens plus « ancien » mais jamais enregistré du syntagme industrie de la langue, à savoir l’introduction des dimensions relatives aux recherches lexicographiques, et même grammaticales, ainsi que leurs produits.

À n’en pas douter, il existe deux visions du concept des « industries de la langue » : la première est une perception informatique qui veut que les IDLL consistent à traiter une langue naturelle à l’aide de l’ordinateur et pour l’ordinateur, que l’intervention de ce dernier soit centrale ou périphérique; la seconde est une perception linguistique qui stipule que les IDLL sont un ensemble d’activités « visant à concevoir, fabriquer et commercialiser des appareils et des logiciels qui manipulent, interprètent et génèrent le langage humain, aussi bien sous sa forme écrite que sous sa forme parlée » (L’Homme, 1988, p. 71). Les produits qui naissent de l’activité industrielle doivent être diffusés et rejoindre les publics pour lesquels ils sont conçus.

Dans l’exposé qui a précédé, on a pu montrer que les formes composites (constructions, syntagmes, expressions, locutions, etc.) « que le lexicographe met en cage et en listes » (Rey, 1985a, p. XXXV), jouent un rôle quantitatif et qualitatif prépondérant dans les DGM. Dans plusieurs répertoires, on a entrepris la systématisation des constructions, on a commencé à sortir les mots de leur isolement graphique pour leur donner un statut un peu plus en adéquation avec leur valeur sémantique, notamment en leur ouvrant les portes de la sous-entrée (voir MR : 1. trait : AU TRAIT, À GRANDS TRAITS, TRAIT DE..., AVOIR TRAIT À). En raison de sa coalescence sémantique, le syntagme général ou terminologique réclame la même naturalisation macro- ou microstructurale. Il faudrait le sortir de l’antichambre de l’à-peu-près et le pourvoir de critères rigoureux et constants, appliqués systématiquement et qui en régissent la consignation.

Le renforcement de la présence du syntagme dans les dictionnaires est lié à un aspect des industries de la langue qu’il faut maintenant préciser. La lexicographie générale a tout intérêt à développer des logiciels de découpage des mots qui aillent au-delà de la forme simple pour intégrer des séquences graphiques interrompues. Il est clair que l’un des problèmes les plus difficiles que devront résoudre les logiciels de reconnaissance des mots est sans contredit l’himalaya que représente les assemblages de formations complexes à sens unique. Et lorsque la sémantique se mêle de la partie, on voit poindre le nez de l’intelligence artificielle. Le défi des lexicographes est ici identique à ceux qui ont déjà été identifiés pour d’autres zones de recherche dans le secteur des IDLL. En tant qu’activité linguistique qui doit se pencher sur les comportements morphologiques, syntaxiques et sémantiques des plurimots et en tant que produit commercial, le dictionnaire de langue nécessite un apport informatique en amont et en aval de son élaboration. Perçus sous cet angle, la lexicographie et le dictionnaire sont aussi des créatures des IDLL. Personne ne le contestera lorsque chacun pourra « ouvrir » son Robert ou son Larousse en poussant quelques boutons de la télécommande ou du clavier de son minitel ou en faisant tourner le vidéodisque de son Dictionnaire thématique visuel. Ces gestes seront bientôt quotidiens et naturels. Ils n’appartiennent déjà plus au domaine de l’imaginaire ni à celui de la linguistique-fiction. Ils sont déjà entrés dans l’histoire de la lexicographie et de la linguismatique. Encore faut-il que chaque question trouve sa réponse! C’est à mon sens l’un des grands défis immédiats de la lexicographie.

Bibliographie

Linguistique

AUGER, Pierre (1988) : « Le travail du terminologue amélioré et simplifié », Circuit, no 22, septembre, pp. 12-13.

BOULANGER, Jean-Claude (1986) : Aspects de l’interdiction dans la lexicographie française contemporaine, coll. « Lexicographica », Series Maior, no 13, Tübingen, Max Niemeyer Verlag, IX + 166 p.

BOULANGER, Jean-Claude (1988a) : « Le statut du syntagme dans les dictionnaires généraux monolingues », (dans ce numéro).

BOULANGER, Jean-Claude (1988b) : « Remarques sur l’aménagement du statut du français en informatique », Annie Bourret et Marie-Claude L’Homme (éd.), Les industries de la langue : au confluent de la linguistique et de 1’informatique, sous la direction de Pierre Auger, avec la collaboration de Carole Verreault], coll. « K », no 9, Québec, Centre international de recherche sur le bilinguisme, Université Laval, pp. 61-19. BOULANGER, Jean-Claude) et Dorothy Nakos (1988) : « Le syntagme terminologique » : Bibliographie sélective et analytique (1960-1988), coll. « K », no 7, Québec, Centre international de recherche sur le bilinguisme, Université Laval, 81 p.

GUILBERT, Louis (1970) : « La dérivation syntagmatique dans les vocabulaires scientifiques et techniques, dans Les langues de spécialité (Analyse linguistique et recherche pédagogique) », Actes du stage de Saint-Cloud, 23-30 novembre 1967, Publication du Conseil de l’Europe, Strasbourg, Aidela, p. 116-125. GUILBERT, Louis (1971) : « Fondements lexicologiques du dictionnaire. De la formation des unités lexicales », Grand Larousse de la langue française, Paris, Librairie Larousse, T. 1, pp. IX-LXXXI.

GUILBERT, Louis, René Lagane et Georges Niobey (1971) : « Préface. Un nouveau dictionnaire de la langue française », Grand Larousse de la langue française, Paris, Librairie Larousse, T. 1, pp. I-V.

KOCOUREK, Rostislav (1982) : La langue française de la technique et de ta science, Wiesbaden, Oscar Brandstetter, 262 p.

L’HOMME, Marie-Claude (1988) : [sous la direction de Pierre Auger, Jean-Claude Boulanger et Conrad Ouellon], « Origine et développement des industries de la langue », coll. « K », no 8, Québec, Centre international de recherche sur le bilinguisme, Université Laval, V + 141 p.

REY, (Alain (1977) : « La terminologie : réflexions sur une pratique et sur sa théorie », Terminologies 76, Actes du Colloque international, Paris-La Défense, 15-18 juin 1976, Paris, La Maison du dictionnaire, pp. V-14-V-40. REY, Alain (1985a) : « Préface », Le Grand Robert de ta langue française, Dictionnaire alphabétique et analogique de la langue française, 2e édition entièrement revue et augmentée par A. Rey, Paris, Dictionnaires Le Robert, pp. XVII-XLII.

REY, Alain (1985b) : « La terminologie dans un dictionnaire général de la langue française : le Grand Robert », TermNet News, no 14, pp. 5-7.

REY-DEBOVE, Josette (1971) : Étude linguistique et sémiotique des dictionnaires français contemporains, coll. « Approaches to Semiotics », no 13, The Hague/Paris, Mouton, 331 p.

SAGER, Juan Carlos (1979) : « Commentary of Pierre Auger’s Paper, « La syntagmatique terminologique, typologie des syntagmes et limite des modèles en structure complexe » », Table ronde sur les problèmes du découpage du terme, Montréal, 26 août 1978, Ve Congrès de l’Association internationale de linguistique appliquée (AILA), 20 au 26 août 1978, Montréal, Office de la langue française, Éditeur officiel du Québec, novembre, pp. 37-52.

Dictionnaires

CORBEIL, Jean-Claude (1986) : Dictionnaire thématique visuel, Montréal, Les Éditions Québec/Amérique inc., 800 p. [DTV]

CÔTE, Normand (1983) : Vocabulaire des papiers et des cartons (anglais-français), coll. « Cahiers de l’Office de la langue française », Québec, Gouvernement du Québec, 79 p.

Grand Larousse de la langue française (1971-1978) : [sous la direction de L. Guilbert, R. Lagane, G. Niobey, avec le concours de H. Bonnard, L. Casati, A. Lerond], Paris, Librairie Larousse, 7 vol., CXXVIII + 6 730 p. [GLLF]

Le Micro-Robert. Langue française plus noms propres, chronologie, cartes (1988), Rédaction dirigée par Alain Rey, Paris, Dictionnaires Le Robert, XXVII + 1 992 p. [MR]

Petit Larousse illustré (1989, 1988), Paris, Librairie Larousse, 1 680 p. + Atlas. [PLI]

ROBERT, Paul (1985) : Le Grand Robert de la langue française. Dictionnaire alphabétique et analogique de la langue française, 2e édition entièrement revue et augmentée par A. Rey, Paris, Dictionnaires Le Robert, 9 vol., LVIII p. + p.v. [GRLF]

ROBERT, Paul (1988) : Le Petit Robert 1. Dictionnaire alphabétique et analogique de la langue française, Nouvelle édition revue, corrigée et mise à jour, Rédaction dirigée par Alain Rey et Josette Rey-Debove, Paris, S.N.L. — Dictionnaires Le Robert, XXXI + 2175 p. [PR]

Annexes

Liste alphabétique des constituants des syntagmes construits avec la base carton (voir Côte, 1983)
Mot Catégorie lexicale Occurrences GRLF PLI Commun aux deux dict.
accumulateur nom 1 + + *
affiche nom 1 + + *
albâtre nom 1 + + *
allumette nom 2 + + *
amiante nom 1 + + *
armé adj. 1 + + *
billet nom 1 + + *
bitumé adj. 1 + -
blanc adj. 1 + + *
bloc-notes nom 1 + + *
bois nom 1 + + *
boîte nom 1 + + *
brillant adj. 1 + + *
bristol nom 4 + + *
brun adj. 1 + + *
brut adj. 1 + + *
buvard nom 1 + + *
cadre nom 1 + + *
calendrier nom 1 + + *
cannelure nom 3 + + *
carrosserie nom 1 + + *
carte nom 3 + + *
chaussure nom 2 + + *
chemin nom 1 + + *
chemise nom 1 + + *
chêne nom 1 + + *
chimique adj. 1 + + *
chiné adj. 1 + + *
cible nom 1 + + *
combiné adj. 2 + + *
comprimé adj. 1 + + *
construction nom 1 + + *
contrecollé adj. 4 + + *
contrefort nom 1 + + *
couche nom 4 + + *
couché adj. 4 + + *
crachoir nom 1 + + *
croquis nom 1 + + *
cuir nom 2 + + *
dessin nom 1 + + *
diélectrique adj. 1 + + *
dos nom 1 + + *
double adj. 4 + + *
doublé adj. 1 + + *
doublure nom 3 + + *
duplex nom 1 + + *
dur adj. 1 + + *
écru adj. 1 + + *
emboutissage nom 1 + + *
entoilé adj. 1 + -
fabriqué adj. 1 + -
face nom 4 + + *
fer nom 1 + + *
fibre nom 1 + + *
fiche nom 1 + + *
forme nom 1 + + *
fossile nom 1 + + *
gabarit nom 1 + + *
gaufré adj. 1 + -
glacis nom 1 + + *
goudronné adj. 1 + -
gris adj. 7 + + *
haut adj. 1 + + *
huilé adj. 1 + -
imprégné adj. 1 + -
impression nom 1 + + *
intérieur adj. 1 + + *
isolant adj. 1 + + *
ivoire nom 2 + + *
jacquard nom 1 + + *
jouer verbe 1 + + *
jute nom 1 + + *
kraft nom 2 + + *
laqué adj. 1 + + *
malle nom 1 + + *
manille nom 1 + + *
maroquinerie nom 1 + + *
massicot nom 1 + + *
matrice nom 1 + + *
mécanique adj. 2 + + *
mi- préf. 1 + + *
mono préf. 1 + -
mou adj. 1 + + *
moulage nom 1 + + *
multi- préf. 1 + -
ondulé adj. 8 + + *
onduler verbe 1 + + *
paille nom 2 + + *
pâte nom 4 + + *
patron nom 1 + + *
perforé adj. 1 + -
plastifié adj. 1 + -
pliage nom 1 + + *
pochoir nom 1 + + *
postal adj. 1 + + *
présentoir nom 1 + + *
revêtement nom 1 + + *
rond adj. 1 + + *
satiné adj. 1 + + *
semelle nom 1 + + *
simili- préf. 3 + -
simple adj. 2 + -
soierie nom 1 + + *
sol nom 1 + + *
stratifié adj. 1 + + *
supérieur adj. 1 + + *
support nom 1 + + *
talon nom 1 + + *
ticket nom 1 + + *
tourbe nom 1 + + *
triple nom 2 + + *
tube nom 1 + + *
112 166 119 99 99

Le statut du syntagme dans les dictionnaires généraux monolingues

Introduction

En linguistique, le terme syntagme est polysémique —homonymique diraient les terminologues— ce qui, à première vue, peut paraître gênant lorsque des spécialistes des questions de langue discutent entre eux et qu’ils sont d’obédiences différentes. Au moins trois sens peuvent le caractériser. Délaissant le syntagme saussurien et le syntagme chomskyen, je focaliserai mon attention sur le syntagme terminologique, qui, il ne faut pas se le cacher, doit beaucoup à ses devanciers et dont il n’est en somme qu’une spécialisation par restriction de sens comme l’indique le déterminant terminologique qu’on lui accole fréquemment. Le ST sera défini comme étant un groupe de mots séparés par des blancs, syntaxiquement liés et identifiant une notion unique dans un domaine déterminé du savoir. Le syntagme est donc un terme. Il s’oppose au terme simple constitué d’un seul mot graphique (ex. maculature, infographie ou de deux mots ou plus reliés par un trait d’union (ex. page-écran, gros-porteur; arrière-petits-enfants, porte-à-faux) ou une autre marque graphique (ex. : presqu île, pop’ art, avion + auto; filtre/occillateur, roll-in/roll-out). La notion de « syntagme terminologique », ou plus commodément de « syntagme », est rendue en français par une prolifération de synonymes dont une trentaine ont été catalogués jusqu’à présent (voir Kocourek, 1982 : 117). En ce moment, le terme syntagme semble le choix des Québécois tandis que les Français lui préfèrent souvent la forme composée, ce qui n’est pas sans causer quelques difficultés de compréhension entre les chercheurs des deux espaces géographiques. Il faut cependant préciser que dans le milieu des praticiens de la terminologie, c’est le terme syntagme qui l’emporte, que ce soit en Amérique du Nord ou en Europe. Il se trouve aussi dans des écrits lexicographiques et métalexicographiques. Josette Rey-Debove (1971 : 112) dénomme syntagme « les entrées formées de plusieurs mots graphiques (simples ou composés) non reliés ». Quant à Alain Rey (1988 : XIII), il distingue bien une série d’unités complexes parmi lesquelles il reconnaît les syntagmes courants ou terminologiques, les locutions et les proverbes.

Les nuances terminologiques étant évoquées, il reste à rappeler quelques principes terminologiques importants.

En terminologie, le terme s’oppose au mot. Le premier identifie spécifiquement les unités lexicales des langues de spécialité (LSP) tandis que le second circonscrit les unités lexicales de la langue générale (LG) ou courante. Du point de vue théorique, cette distinction est utile et fonctionnelle.

Le syntagme terminologique peut être simple, c’est-à-dire correspondre à une structure de base binaire telle que définie par Louis Guilbert (1970 : 117-119) : ex. banc de neige, permis de conduire, pluies acides, laveur-récupérateur de liqueur, conducteur d’excavateur-compresseur; il peut aussi être complexe, c’est-à-dire dériver d’une structure modèle élémentaire par l’intermédiaire d’une expansion déterminative : ex. papier couché à haut brillant, station mobile terrestre, stabilisation par gradient de gravité, carton gris doublé blanc une face.

Incontestablement, si l’on se place du point de vue lexical, le syntagme constitue la caractéristique dominante en terminologie. Diverses évaluations fixent à environ 80% la proportion moyenne des unités synaptiques dans les LSP. Une vérification menée dans deux dictionnaires terminologiques, l’un consacré au vocabulaire des papiers des cartons (Côte : 1983) et l’autre aux appelations d’emplois dans l’industrie papetière québécoise (Côte : 1982), fournit les données suivantes :

Si l’on réunit les deux nomenclatures, la moyenne se situe à 82,9%, ce qui confirme d’une manière concrète les projections faites à partir d’autres sources (voir les tableaux 1 et 2).

Tableau 1 : Catégories d’entrées dans un DT : nombre
Dictionnaires
Types d’entrées
VPC AEIPQ Total
Syntagmes 564 223 787
Termes composés 25 26 51
Termes simples 21 55 76
Total 610 304 914
Tableau 2 : Catégories d’entrées dans un DT : pourcentage
Dictionnaires
Types d’entrées
VPC AEIPQ Total
Syntagmes 92,5% 73,3% 82,9%
Termes composés 4,1% 8,6% 6,35%
Termes simples 3,4% 18,1% 10,75
Total 100% 100% 100%

Le dictionnaire terminologique (DT) est élaboré en s’inspirant de principes onomasiologiques (primauté du concept sur le signe) tandis que le dictionnaire général monolingue (DGM) s’appuie sur une démarche sémasiologique (primauté du signe sur le signifié). Les unités lexicales rassemblées et définies dans les répertoires de langue, y compris les lexies complexes, sont considérées sous l’angle le plus général du lexique : le mot graphique, « alors que dans les DT, les termes sont au moins en théorie — le produit d’une opération onomasiologique de désignation » (Rey, 1987 : 8). La vision du lexicographe l’amène alors à percevoir le syntagme comme le résultat de la « formation d’une nouvelle unité lexicale complexe par association d’unités lexicales simples empruntées au fonds commun du lexique » (Phal, 1969 : 76). De ce fait, il hésitera à faire du syntagme une entrée autonome dans son dictionnaire sauf si celui-ci « est à la fois détaché de sa source et par lui-même important (chemin de fer, repris de justice) » (Rey, 1988 : XIII). Il est alors traité en véritable mot et logé à sa place alphabétique. Dans tous les autres cas, infiniment plus nombreux, le dictionnairiste refragmentera la synapsie en ses éléments constituants afin de sélectionner un mot-pivot et de reconstruire le syntagme dans la microstructure déployée sous ce mot principal. Pour le terminographe, les séquences syntagmatiques « ont la même cohérence interne et le même caractère de nécessité que chemin de fer. C’est dire que dans le domaine des sciences et des techniques, les cadres de la lexicalisation sont considérablement plus extensibles que ceux du dictionnaire le plus accueillant » (Phal, 1969 : 76).

C’est en ayant ces considérations à l’esprit que l’on pénétrera au cœur d’une étude qui croise la trame lexicographique (le contenant) avec la chaîne terminologique (le contenu).

Terminologie et dictionnaire de langues

C’est un fait facilement observable que les DGM ne restreignent pas leur nomenclature aux mots et aux sens d’usage courant. De tous temps, des vocabulaires spécialisés se sont banalisés, vulgarisés; ils sont sortis du cercle de l’usage réservé aux spécialistes pour s’introduire dans les dictionnaires destinés à un vaste public. Il n’est plus guère possible d’ignorer le passage de plus en plus fréquent des terminologies dans la sphère d’influencer des DGM comme en font foi la plupart des préfaces, des introductions ou des présentations des répertoires récents (voir Boulanger, 1986 : 63 et suiv.). La langue propose au locuteur des unités lexicales complexes qu’il est nécessaire d’apprendre et de maîtriser aussi bien que les mots simples (ex. conte de fées, ordre alphabétique, point de vue).

En outre, la majeure partie des refontes ou des mises à jour des dictionnaires généraux repose sur l’introduction du contingent lexical terminologique, les mots de la langue courante se présentant en nombre plus limité.

Par ailleurs, il est quasi impossible de séparer l’étude des termes de l’étude des mots étant donné la possibilité pour les premiers de se transformer en mots (ex. interface, qui a acquis un sens métaphorique : « deux aspects d’un même problème », voir CRLF) et pour les seconds de revêtir l’habit terminologique (ex. : beauté, charme, couleur, étrangeté qui ont émigré vers la physique nucléaire, sans doute sous l’influence de l’anglais). Rien en lexicologie ne permet de distinguer le signifiant LG du signifiant LSP. Deux formes aussi banales que bruit et blanc peuvent s’associer pour donner bruit blanc dont le sens est : « Bruit à spectre continu dont la densité spectrale d’énergie est pratiquement constante dans un intervalle de fréquences spécifié » (Vocabulaire des sciences et techniques spatiales, 1978 : 27). Ce syntagme du domaine de l’électromagnétisme possède une charge sémantique très forte qui est loin d’être détectable à partir de l’assemblage fortuit de deux signifiants au sémantisme par ailleurs transparent et polyvalent.

Il est donc naturel de rencontrer des termes dans les DGM. Ils y ont le statut d’entrées indépendantes et cela depuis la naissance de la lexicographie française. En général, ils sont repérables grâce à une étiquette de niveau de spécialisation socioprofessionnelle qui les accompagne. Lorsqu’elle est présente, cette étiquette est coincée quelque part entre l’indicatif du sens (numéro, signe diacritique ou minifigure : losange, carré, cercle) et la définition (ex. chélate, chim., chélicère, zool., chélidoine, bot., chéloide, méd. (GRLF)). La marque d’appartenance technolectale capture le terme et l’insère dans une typologie classologique (cf. Rey, 1987 : 8).

La place du ST dans les DGM

Même s’ils les discutent, les lexicographes généralistes reconnaissent tous l’importance des unités complexes dans les dictionnaires. Le phénomène est historique car les dictionnairistes ont toujours pris des libertés avec les mots graphiques. Au XVIIIe siècle, pour prendre un exemple et pour ne pas remonter trop loin dans le temps, des syntagmes ont déjà accès au statut d’entrée (ex. bouton de mer, Trévoux, 1771).

Tout en n’ignorant pas l’importance qualitative et quantitative des ST, « le dictionnaire de langue doit effectuer une sélection sévère, sous peine d’assommer son lecteur de mots et d’expressions (ou syntagmes) désignant des réalités qui ne sont nommées que dans des activités hyperspécialisées de la connaissance. [...] si l’on tient compte du fait que de nombreux termes ne sont pas des mots simples, mais des « syntagmes » — et ceci est vrai de bien des « mots » courants : grand ensemble est traité à part —, les nomenclatures deviennent plus impressionnantes » (Rey, 1985 : XXIV). Selon l’estimation du lexicographe robertien, un DGM de 80 000 entrées contiendrait environ 500 000 syntagmes terminologiques disséminés au travers les articles, une moyenne assez impressionnante par article (cf. Rey, 1985 : XXIV n. 6)

La sélection des entrées

L’entrée est la principale voie d’accès au dictionnaire de langue. Or, il n’est pas besoin de feuilleter longuement un répertoire pour constater que toutes les adresses lexicographiques n’ont pas la même physionomie. Quatre grands groupes sont facilement repérables : les éléments de formation : préfixes, suffixes, etc. (ex. ana-, -and), les mots simples (ex. musique, francophonie), les mots composés, au sens traditionnel du terme (ex. analyste-programmeur, lave-mains), et les syntagmes (ex. bel canto, repris de justice). Les quatre modèles procèdent de l’inframot au supramot. Les modes de classement reposent sur le déroulement de la séquence graphique dans laquelle intervient ou non une rupture sous la forme d’un signe ou d’un blanc typographique.

Afin de vérifier si les constats visuels répondaient à des propositions théoriques ou méthodologiques communes, j’ai examiné les opinions de quelques lexicographes. En 1971, les frères Dubois (Larousse) soutenaient que « les entrées lexicographiques doivent être des « mots » compris entre deux blancs typographiques au sens le plus strict. [...] Les mots composés dont les éléments composants sont séparés par un trait d’union (coffre-fort), ou dont les éléments ne sont pas séparés (gentilhomme) sont des mots et constituent des entrées. En revanche, les termes composés (syntagmes) dont les composantes ne sont pas réunies par le trait d’union et qui sont ainsi séparées par un blanc ne sont pas reconnues comme des entrées : ainsi pomme de terre, chou rave (contrairement à chou-fleur), compte rendu (contrairement à compte-gouttes), etc. [...] C’est la présence ou l’absence du trait d’union qui définit les mots composés qui peuvent être des entrées et ceux qui ne sont que des sous-entrées (ainsi pomme de terre est à pomme, compte courant est à compte, etc.) » (Dubois/Dubois, 1971 : 62). La forme graphique, basée sur la non-interruption de la séquence de lettres et de signes diacritiques, l’emportait alors sur le sens ou la démotivation étymologique.

À la même époque, pour Josette Rey-Debove (1971 : 114), il est clair que suivant le principe de la double structure lexicographique, « qui seul permet de séparer la langue de ses réalisations en discours, tout mot graphique simple ou composé, réduit à sa forme canonique (regroupement des variantes) doit figurer à la nomenclature, et non dans la micro-structure où il ne représente qu’une unité de discours (exemple) ». Par ailleurs, tout « syntagme » à sens particulier non déductible de celui de ses composants devrait figurer à la nomenclature (Rey-Debove, 1971 : 117).

Les discussions sur la place du syntagme dans le DGM trouvent d’autres échos, notamment chez les métalexicographes. Ainsi, « aucun dictionnaire ne peut se permettre de consacrer une entrée à chacun des ensembles qui pourraient être des mots composés ou des synapsies : en plaçant bateau-citerne, bateau-mouche, etc. à l’intérieur de l’article bateau (malgré les traits d’union), tout comme bateau à moteur et bateau de commerce, etc. le p.R. gagne une place précieuse, qu’il gaspillerait en faisant de chaque composé une entrée » (Collignon/Glatigny, 1978 : 67).

Les positions oscillent entre les contraintes créées par la définition du concept de « mot » (point de vue théorique et linguistique) et les raisons proprement matérielles (augmenter le contenu des ouvrages). Aujourd’hui encore, les conventions lexicographiques traditionnelles perdurent dans le choix de la forme lexicale qui servira d’entrée; cette forme est « celle du mot défini par le critère graphique de la séparabilité dans l’énoncé; cela suppose un système de signification idéal selon lequel à l’unicité morphologique du mot correspondrait l’unicité du concept » (Guilbert, 1969 : 7).

En fait, la sélection des unités qui joueront le rôle de chef d’article repose sur une ensemble de principes aussi divers que le principe commercial et financier (le budget), le principe idéologique (la formation et la personnalité des rédacteurs-lexicographes), le principe du programme dictionnairique (public-cible, taille de la nomenclature) et le principe lexicographique lui-même (rapports entre macrostructure et microstructure lors du traitement de l’article).

Un relevé de la séquence CHE- dans cinq dictionnaires permet d’illustrer concrètement le comportement nomenclatural de la lexicographie française.

Tableau 3 : Catégories d’entrées dans un DGM : nombre
Dictionnaires
Types d’entrées
GRLF 85 DFP 88 PR 84 PLI 88 PLI 89
Mots simples 169 129 108 114 122
Mots composés 10 4 10 11 12
Élém. de formation 9 0 0 0 0
Syntagmes 1 1 2 1 1
Total 189 134 120 126 135
Tableau 4 : Catégories d’entrées dans un DGM : pourcentage
Dictionnaires
Types d’entrées
GRLF 85 DFP 88 PR 84 PLI 88 PLI 89
Mots simples 89,4% 96,3% 90,0% 90,5% 90,4%
Mots composés 5,3% 3,0% 8,3% 8,7% 8,9%
Élém. de formation 4,8% 0,0% 0,0% 0,0% 0,0%
Syntagmes 0,5% 0,7% 1,7% 0,8% 0,7%
Total 100% 100% 100% 100% 100%

Les résultats observés n’offrent aucune surprise. Les quatre catégories de vedettes sont représentées dans des proportions que révèlent bien les deux tableaux précédents. La macrostructure est dominée dans une proportion écrasante par les mots simples (uni-mots). La moyenne atteint 91,2% (642/704). Les mots composés arrivent en deuxième place, tandis que les syntagmes et les éléments de formation se partagent la troisième ou la quatrième position selon les dictionnaires. Le syntagme chemin de fer est présent partout; l’autre syntagme enregistré dans le PR84 est chêne vert. Il n’est pas question de tirer des conclusions défitinives à partir d’un corpus si réduit. Les résultats pourraient varier suivant la tranche nomenclaturale étudiée, ou encore suivant le nombre beaucoup plus grand d’adresses vérifiées ou suivant les dictionnaires dépouillés. Une projection toute intuitive permet de considérer le schéma offert par le GRLF comme étant le plus plausible. En effet, la séquence CHE- ne contient pas beaucoup d’affixes; on y repère plutôt des éléments savants non pris en compte dans les quatre dictionnaires en un volume. Les affixes sont présents en plus grand nombre ailleurs dans ces recueils.

Quant au syntagme, on peut considérer que la diversité de ses formes, son instabilité conceptuelle (dans le cas des syntagmes de discours), sa longueur souvent encombrante, son rôle en langue générale et l’absence de consensus à son égard sont les principaux aspects qu’il faut scruter lorsqu’on le met en rapport avec la lexicographie et les DGM. Si l’on prend, par exemple, le critère de la longueur du syntagme, on remarque que la lexie complexe retenue en entrée ne franchit pas le seuil du schéma de base guilbertien comportant deux, trois ou quatre composants, y compris les joncteurs ou les ligaments syntaxiques. Au delà de cette taille, naine pour qui connaît le ST, les mots complexes ne sont généralement pas admis à figurer comme têtes d’article.

Le lexicographe poursuit avant tout des objectifs synoptiques. Aussi, les longues locutions, les proverbes et les syntagmes sont-ils refoulés le plus souvent dans la micro-structure, du moins dans l’état actuel de la lexicographie française. À noter cependant, que les deux premières catégories d’expressions sont toujours accompagnées d’une marque spéciale dans l’article (loc. ou prov.), ce qui n’est pas encore le cas du syntagme figé, non plus que lorsqu’il est répertorié en entrée, ni dans le corps de l’article. Il est sans doute temps d’y voir et de fournir au syntagme son propre fil d’Ariane au sein de l’article de dictionnaire.

La présentation de l’entrée syntagmatique

Une fois que le terme complexe a été sélectionné pour être porté au catalogue macrostructural, il doit être lemmatisé, c’est-à-dire neutralisé. Plusieurs méthodes de présentation du syntagme en entrée ont été répertoriées (voir le tableau 5).

Tableau 5 : Formes de l’entrée syntagmatique dans les DGM
Formes Statut dans l’article Exemples Dictionnaires
Séquence naturelle Article complet [1] chemin de fer GRLF/PLI/DFP
Entrée-renvoi [3] (+ cat. gr. et pron.) parti prisparti GRL
Variante graphique (+ article complet) [7] compte chèques/compte-chèques PLI
big-bang/big bang PLI
Séquence permutée Article complet [2] frise (cheval de) GRLF
Bénioff (plan de) PLI
Bengale (feu de) GRLF
Entrée-renvoi (+ cat. gr.) [4] Pandore (boîte de) → Pandore et boîte GRLF
Double lecture Article complet [5] club(-)sandwich DFP
Entrée-renvoi [6] tous(-)terrainsterrain DFP
Réduction syntagmatique Base conservée Article complet [8] reprisrepris de justice PLI
Expansion conservée Article complet [8] patronessedame patronesse GRLF/PLI/DFP

1. Le syntagme se déroule conformément à la succession naturelle de ses éléments constituants (ex. GRLF; big bang, chemin de fer, grand ensemble, Yorkshire pudding). Il donne accès au développement microstructural complet, signe de reconnaissance de l’autonomie du mot d’entrée tant au plan formel que sémantique.

2. La formulation syntagmatique n’obéit pas toujours à l’ordre linéaire discursif naturel. On rencontre, à l’occasion, une vedette complexe dont les éléments ont été permutés. La base est reportée entre parenthèses après l’expansion qui devient la clé d’accès alphabétique (ex. GRLF : frise (cheval de), Bengale (feu de); PLI : Bénioff (plan de)). La forme d’accès à l’article est aussi bien un nom commun (frise) qu’un nom propre (Bengale, Bénioff), ce qui, dans le dernier cas, est un peu contradictoire dans un dictionnaire de langue. Le développement microstructural complet se déploie ensuite sous l’entrée concrétisant la reconnaissance d’une certaine cohésion entre les composants, mais rejetant l’autonomie complète, du moins en apparence.

3. Le syntagme, offert dans sa séquence naturelle, ne constitue qu’une entrée-renvoi, avec ou sans début de développement microstructural. Ainsi, plat de côtes, plat à main, parti pris (GRLF) sont accompagnés de leur catégorisation lexico-grammaticale et de leur prononciation. Mais ce ne sont que des entrées-renvois à des articles plus complets (plat et parti) où il sont relocalisables. L’autonomie du syntagme est incertaine.

4. Le syntagme est repérable dans sa séquence inversée tout en conservant son statut d’entrée-renvoi. Il peut être suivi ou non d’un début de développement microstructural. Ainsi, l’anthroponyme Pandore sert d’accès au syntagme boîte de Pandore dans le GRLF. On trouve l’entrée sous la forme Pandore (boîte de), suivie de la catégorisation locution nominale et de deux renvois, l’un à boîte, l’autre à Pandore. L’autonomie du syntagme est incertaine.

5. Le syntagme et le mot composé sont fusionnés dans une formulation à double lecture. Un développement suit l’entrée (ex. DFP : club(-)sandwich qui s’écrit club sandwich ou club-sandwich). L’autonomie du syntagme est reconnue. L’arrivée du trait d’union concrétise la cohésion des éléments.

6. Le syntagme et le composé sont présentés en double lecture par l’intermédiaire d’un artifice, les parenthèses, qui enferment le trait-d’union. Aucun développement ne suit la séquence. Il s’agit d’une simple entrée qui oriente le consulteur vers un article principal (ex. DFP : tous(-)terrains, tout(-)terrain qui renvoient à terrain). Malgré la présence du signe de liaison des éléments, le syntagme ne paraît pas autonome.

7. Le syntagme est présenté suivant l’ordre naturel de la séquence mais il est suivi (ex. PLI : compte-chèques, compte rendu) ou précédé (ex. PLI : big bang). Un développement suit l’entrée concrétisant l’autonomie du syntagme. Le trait d’union vient en outre confirmer la cohésion des parties au plan sémantique.

8. Un mot simple qui n’a pas d’existence autonome en dehors de son insertion dans une formule syntagmatique peut servir de guide pour accéder à l’article. Dans ce cas, la base ou l’expansion qui résultent de la troncation servent à introduire la sous-entrée syntagmatique complète qui est elle-même pourvue du discours lexicographique habituel. Ainsi, repris de justice dans le PLI tandis que patronesse donne un article dame patronesse dans le GRLF, le PLI et le DFP. C’est l’amorce microstructurale qui témoigne ici du statut syntagmatique de la forme ou plutôt du fragment choisi comme entrée. Mais nous sommes déjà ici à cheval sur la microstructure.

Conclusion

On s’est intéressé ici au syntagme en tant qu’unité lexicale codée et que forme composite figée, caractérisée par la présence concomitante d’éléments lexicaux qui offrent une cohésion sémantique suffisante pour que le groupe graphique puisse être identifié à un concept unique. Sans être strictement limitées au volet terminologique, les observations sont quand même demeurées au plan lexical nominal, délaissant pour le moment les syntagmes grammaticaux du genre bien que, en bref, de bric et de broc, à brûle-pourpoint.

Dans cette première approche du rôle du syntagme en lexicographie générale, on s’est arrêté sur le seul aspect macrostructural, sur la manifestation la plus immédiatement visible des mots complexes dans les DGM. Quelques vérifications dont on vient de rendre compte démontrent la complexité du phénomène et l’absence de politique cohérente d’un dictionnaire à l’autre.

L’arbre cache ici la forêt. Il reste en effet à poursuivre l’examen amorcé en pénétrant au cœur de l’article pour y repérer les différentes modalités de traitement du syntagme. De brefs coups de sonde promettent des résultats étonnants.

En attendant, il paraît évident que la lexicographie générale est en pleine métamorphose en ce moment. Elle cherche à allier l’innovation et la tradition sous l’influence de plusieurs sources de pression dont la terminologie n’est pas la moindre. Avec comme objectif de mieux décrire le lexique et de rendre le contenu didactique des DGM plus efficace. Chose certaine, le syntagme ne laisse plus les dictionnairistes indifférents et cela est bien pour l’avenir de la (méta) lexicographie.

Bibliographie

Linguistique

Dictionnaires

Note

[1] Je remercie Marie-Claude L’Homme, étudiante à la maîtrise, qui s’est chargée de la compilation des données.