La renaissance d’une langue et d’un dictionnaire : le cas du catalan

Jean-Claude Boulanger

« El que és segur és que totes les paraules incloses en el diccionari són correctes. Però això no vol dir que les paraules que no són en el volum siguin incorrectes. » (Maria Teresa Cabré, in Avui, 27 d’octubre de 1994, p. B1.)

1. La chaîne dictionnairique catalane

En 1991, paraissait à Barcelone un ouvrage documentaire intitulé Els diccionaris catalans de 1940 a 1988[1]. Ce catalogue compilatoire faisait le point sur la production dictionnairique catalane échelonnée sur une cinquantaine d’années arrimées au cœur du XXe siècle. La quête commence en 1940 parce que d’autres bibliographies déjà publiées ou en cours font l’inventaire des dictionnaires parus avant ce moment. Le recensement quasi exhaustif a permis de réunir 254 titres d’ouvrages et de présenter les données de chaque répertoire sur une fiche protocolaire informatisée comportant 33 champs d’information que l’on peut diviser en quatre sections : 1. Quatorze champs sont consacrés aux données de catalogage (titre et détails bibliographiques); 2. Cinq champs sont consacrés au programme du dictionnaire (physionomie des entrées, position normative, public cible, genre de classement, catégories d’entrées); 3. Treize champs sont consacrés aux informations prédictionnairiques et microstructurelles, c’est-à-dire aux contenus articulaires; 4. Un champ est consacré aux observations diverses et complémentaires.

L’objectif de la bibliographie était d’inventorier et de classer l’ensemble des répertoires de mots et de termes catalans publiés durant la période visée, à savoir les dictionnaires généraux, les dictionnaires terminologiques, les glossaires, les lexiques, etc., monolingues, bilingues ou multilingues. On y trouve donc des dictionnaires de langue, des dictionnaires spéciaux, des dictionnaires technolectaux, mais pas d’encyclopédie.

Dans cette panoplie de dictionnaires, le nom de Pompeu FABRA (1868-1948) ne revient qu’une seule fois. Il coiffe le titre no 99 : Diccionari manual de la llengua catalana (1983). FABRA a été l’un des grands artisans de l’aménagement lexicographique du catalan. En 1932, il publia son Diccionari general de la llengua catalana [DGLC], sur lequel nous reviendrons souvent à l’occasion de l’examen approfondi du récent Diccionari de la llengua catalana [DLC] publié en 1995 sous l’égide de l’Institut d’estudis catalans [IEC].

2. Le Diccionari de la llengua catalana[2]

Nous nous proposons dans les paragraphes qui suivent d’examiner l’aventure de la mise au monde du DLC dans sa version la plus récente. En amont, nous ferons un retour sur l’historique de la lexicographie catalane institutionnelle; en aval, nous scruterons le programme et le contenu du DLC. L’étude sera strictement fondée sur les informations véhiculées à travers les deux grandes articulations du dictionnaire : la partie des textes prédictionnairiques et la partie proprement lexicographique. Le livre ne propose aucune annexe postdictionnairique.

Le coup d’œil historique sera centré sur deux pôles : un corps organisé, l’Institut d’estudis catalans, et un lexicographe, Pompeu FABRA. Ce tableau débouchera sur les artisans et les responsables de la plus récente édition de l’œuvre entreprise par l’IEC et par FABRA.

3. Les textes prédictionnairiques

Six chapitres composent les quelques dizaines de pages numérotées en chiffres romains. Chacun fera l’objet d’un arrêt plus ou moins long.

3.1. Pròleg (p. V-IX)

Signé par Emili GIRALT i RAVENTÓS, président de l’IEC, le prologue rappelle la vocation du centre et ses responsabilités à l’égard de la langue catalane, de son aménagement et de sa normalisation. Ces préoccupations s’inscrivent dans une série d’objectifs généraux se rapportant aux recherches sur la culture catalane. Dès la fondation de la section philologique en 1911 —l’IEC est né en 1907—, celle-ci a eu pour mission prioritaire de stimuler ou d’enclencher la restauration, le renforcement et l’expansion du catalan ainsi que la normalisation de l’usage. L’équipe de philologues rédige un premier ouvrage à dominante linguistique en 1913, les Normes ortogràfiques, ensuite, en 1917, elle donne un Diccionari ortogràfic, puis, ultérieurement, elle signe la Gramàtica (1918). Le dictionnaire général, d’élaboration plus lente et plus laborieuse, dut attendre jusqu’en 1932 avant de voir le jour, alors que Pompeu FABRA fit paraitre son Diccionari general de la llengua catalana qui sera considéré comme le dictionnaire officiel de l’IEC. Mais l’œuvre était plus personnelle qu’institutionnelle. D’ailleurs FABRA lui-même considérait son recueil comme une toile de fond, un essai qui pourrait servir au futur dictionnaire de l’IEC.

Les objectifs et la démarche étaient très clairs. Il s’agissait d’entreprendre des opérations d’unification de l’orthographe, de mise à niveau du lexique, de fixation de la grammaire et d’enrichissement néologique. Ces aspirations à l’égard de la langue devaient trouver leur point de jonction dans un dictionnaire institutionnel. Ainsi donc, les savants de l’Institut avaient accompli le gros œuvre préalable et « indispensable per a transformar una llengua reduïda als usos literaris en una llengua d’escola i d’Estat, apta a totes les necessitats d’un poble que s’incorpora amb fisonomia pròpria a la complexitat de la vida moderna » (p. VI).

Mais la guerre civile espagnole et ses suites franquistes ont mis un frein aux travaux lexicographiques officiels pendant plus de cinquante ans. Il faudra attendre le 26 novembre 1976 pour que s’amorce un renouveau alors qu’un décret royal redonne vie et visibilité à l’IEC en le reconnaissant officiellement comme un organisme à caractère académique, scientifique et culturel. En 1988, les statuts refondus de l’IEC seront l’occasion de donner un nouveau souffle au projet dictionnairique. L’article 2 stipule en effet que l’un des mandats de l’institution est de « tenir cura de l’estudi de la llengua, establir-ne la normativa i vetllar perquè el seu procés de normalització sigui coherent arreu del seu àmbit lingüístic » (p. VI).

La réforme des statuts a conduit le Parlement de Catalogne à promulguer une loi le 24 avril 1991 dans laquelle il est unanimement reconnu que l’IEC était « encarregada d’establir i actualitzar la normativa lingüística del català » (p. VI-VII) et que toute l’administration catalane devrait respecter la norme établie par la compagnie.

Le signataire du prologue relate ensuite l’histoire de l’aventure du nouveau dictionnaire étape par étape. Je rappelle ici les dates les plus importantes et qui sont relatives aux décisions qui affectent le contenu du DLC (pour les autres détails techniques : édition, publication, gestion du projet..., voir p. VIII-IX).

3.2. Introducció : gestació, història, contingut i formes d’aquest diccionari (p. XI-XL)

L’introduction au dictionnaire est due à l’éminent linguiste et philologue Antoni M. BADIA i MARGARIT, président de la Section philologique de l’IEC. D’hier à aujourd’hui, le texte retrace de manière minutieuse la conception du DLC.

A. M. BADIA rappelle à son tour que le dictionnaire était déjà envisagé dès 1911 et qu’un premier état a été rendu public par Pompeu FABRA en 1932 (voir plus loin). Il remémore également la composition et la structure des cinq sections de l’IEC. Suivons avec lui les différentes étapes chronologiques de la codification de la langue catalane, parcours sur lequel il apporte d’intéressantes précisions.

Sans revenir sur l’historique décrit dans le prologue, rappelons les travaux sur l’orthographe (1913 et 1917), ceux sur la grammaire (1918) et ceux qui ont conduit à la publication du DGLC (1932). Par la suite, les recherches de la section philologique furent envisagées suivant trois directions : le lexique ancien, les parlers dialectaux modernes, le dictionnaire de la langue commune. Comme dans tous les grands travaux d’envergure, la mise en place des équipes ne s’est pas faite sans heurts ni sans quelques différends et oppositions idéologiques entre les membres. Après un coup d’œil historique et circonstancié sur les hommes de la section philologique de l’IEC, A. M. BADIA scrute chacune des trois options de recherche énumérées il y a un instant. Il insiste sur la préparation du dictionnaire, tâche qui à ses yeux s’avérait la plus urgente de tout le projet de réforme. L’ensemble des travaux préparatoires portant sur l’orthographe et la grammaire appartient à la première étape de l’immense chantier linguistique planifié par l’IEC.

La deuxième étape est bien entendu celle des activités de Pompeu FABRA qui ont conduit à la publication de son dictionnaire en 1932. A. M. BADIA explique le long cheminement de la préparation et de l’élaboration de la première édition du DGLC. Il montre quelle place occupait le dictionnaire par rapport à l’IEC et au domaine privé (l’éditeur). Au sortir de cette phase pour le moins longue et difficultueuse, ce qui demeure très positif, c’est que la communauté catalane possédait néanmoins, dès 1932, un dictionnaire normatif, même si l’ouvrage était redevable en partie de l’entreprise privée. L’accueil fait au Fabra fut très favorable aussi bien chez les spécialistes des questions linguistiques que dans la communauté catalane en général.

Sept ans après le lancement du DGLC, en 1939, la langue catalane est interdite, mise au ban par le régime de Franco. Elle entre dans une sorte de clandestinité. Ce qui influera sur la carrière du dictionnaire, car il faudra patienter jusqu’en 1954 avant de pouvoir envisager une mise à jour sérieuse de l’ouvrage de FABRA.

La parution de la deuxième édition du dictionnaire en 1954 marque le début de la troisième étape dans l’aventure lexicographique de l’IEC. Selon A. M. BADIA, l’autorisation accordée à l’Institut par l’État espagnol de reprendre une partie de ses travaux revêt une valeur politique indéniable de quatre points de vue :

En dépit des embuches, des contraintes et des difficultés, le DGLC aura eu les honneurs d’une deuxième édition en 1954. Elle sera suivie de quelques autres rééditions jusqu’à la fin des années 1980 alors que la quatrième étape sera entreprise. Entretemps, la Catalogne aura recouvré quelques-uns de ses droits : en 1977, la Generalitat de Catalunya est rétablie et depuis 1979, elle bénéficie du statut de « grande autonomie ». L’État catalan reprenant sa place, la refonte des instruments linguistiques disponibles, mais qui avaient considérablement vieillis, devenait impérative, notamment en raison des exigences communautaires, sociales, culturelles, administratives, etc. L’IEC se penche alors sur un projet de version actualisée et officielle du dictionnaire. La situation exigeait également une nouvelle facture du recueil tant du point de vue méthodologique que du point de vue des technologies nouvelles auxquelles il fallait recourir pour réaliser les travaux, entre autres l’informatique. Au début des années 1990, un plan de travail en trois points est élaboré. Il s’agit d’un plan qui touche les aspects organisationnels plutôt que des propositions sur le contenu, volet qui suivra l’autre.

En décembre 1994, la section de philologie de l’IEC considérait que le dictionnaire était complété. Il ne restait qu’à l’éditer. Environ 150 personnes ont participé étroitement à sa préparation et à son élaboration.

3.2.1. La physionomie du dictionnaire

Le Diccionari de la llengua catalana est résolument normatif. C’est un ouvrage académique qui poursuit la tradition de l’IEC et des éditions antérieures : 1932, 1954... Il se veut le répertoire qui « estableix la forma i el significat de les paraules reconegudes com a pròpies i generals de la llengua catalana » (p. XXII). Dans la suite de la description du dictionnaire, je reprends les mêmes subdivisions que A. M. BADIA.

3.2.1.1 Les caractéristiques et la singularité du dictionnaire

a) La nomenclature — Pour le présentateur, la valeur d’un dictionnaire ne se mesure pas au nombre d’articles qu’il compte. Trois critères modulent cette réflexion. Premièrement, une nomenclature s’accroit facilement si l’on considère tous les dérivés possibles d’un mot issus des séries ouvertes, comme c’est le cas pour les adverbes en -ment qui se forment automatiquement sur le féminin de l’adjectif, pour les augmentatifs, les diminutifs, les dépréciatifs naturellement dérivables de leur base. Deuxièmement, sur le plan sémantique, l’augmentation des sens peut se faire rapidement si l’on intègre les acceptions métaphoriques banalement déduites des sens concrets. Ces observations sont nuancées par le constat que bien des gens interprètent l’absence d’un mot à la nomenclature comme un fait négatif, réprobateur, comme un écart par rapport à la norme. Ces aspects des contenus des dictionnaires in absencia, si l’on peut dire, amène, en troisième lieu, l’auteur à expliquer la position de l’IEC à l’égard de la néologie et de l’emprunt, de même qu’à donner son avis sur la question de l’incertitude qui existe quant à la vie des mots ou des sens nouveaux. De ce côté, il prône une attitude de prudence avisée, préférant l’attente à l’introduction trop hâtive de formes instables.

b) Les définitions — Le DLC est entièrement construit autour des rubriques sémantiques. La définition en est la pierre angulaire, l’essence véritable. L’allure dépouillée des autres rubriques articulaires retenues —et elles ne sont pas nombreuses (voir plus loin)— focalise toute recherche sur le noyau des sens et des sous-sens.

c) La norme — La perspective normative est colorée par des aspects relatifs aux problèmes morphologiques (orthographe, morphologie, composition des mots) et aux problèmes de signification (propriétés et amplitude des valeurs sémantiques des mots).

3.2.1.2. Les deux constantes du dictionnaire

Le DLC résulte d’abord de l’héritage de la tradition lexicographique de l’IEC, hoirie qu’il n’est pas question de contrecarrer. Il ressort ensuite de l’innovation soumise à la prudence coutumière des institutions officielles. En somme, le projet vise à maintenir un équilibre mesuré entre les deux extrêmes que sont le conservatisme et le laxisme débridé en matière de dictionnaire.

L’héritage, c’est la continuité du travail dans l’esprit de Pompeu FABRA. L’objectif primordial est donc de réaliser un dictionnaire de langue et non un dictionnaire encyclopédique. Le présent recueil de mots se veut avant tout un dictionnaire général monolingue; il tient cependant compte de certains impératifs encyclopédiques quand cela s’avère opportun et convenable, ces informations étant diffusées prioritairement à travers les formules définitionnelles. Sur le plan de l’innovation, le DLC considère l’importance des terminologies, des dialectalismes (la variation régionale), des néologismes, des emprunts, etc., il procède à la nécessaire épuration dans la galaxie des mots et des sens sortis de l’usage (les vocables vieillis, vieux ou obsolètes) et il revoit sa procédure à l’égard des archaïsmes. Il est clair en effet, qu’une entreprise de mise à jour implique des décisions aussi bien à l’égard des entrées nouvelles qu’à l’égard des retraits.

3.2.1.3. Les applications

La mise en application de chacun des aspects précédents exige de tenir compte de l’importante évolution de la langue considérée sous l’angle de son internationalisation et sous l’angle des nouveautés conceptuelles. Ces phénomènes sont tous deux sources de néologie externe, c’est-à-dire productrice d’emprunts, et sources de néologie interne, c’est-à-dire productrice de mots et de sens nouveaux fondés sur les mécanismes de créativité propres à la langue. Les applications sont scrutées à partir de cinq formules binaires.

a) La langue générale et l’information encyclopédique — Le corpus FABRA est amplifié et/ou amélioré. Par exemple, le mot clima comprend deux sens dans le DGLC et trois dans le DLC; mais la différence véritable entre les deux articles réside dans la reconfiguration de la microstructure avec la mise en évidence de trois unités lexicales complexes [ULC] qui accèdent au statut de sous-entrées accompagnées de définitions : clima equatorial, clima mediterrani et clima monsònic. L’autre pôle de l’enrichissement du dictionnaire concerne la consignation de mots nouveaux comme amerindi, anecdotari, aquelarre, benzinera, descolonització, homenot, sexisme, tabulador, videoteca, et bien d’autres. Les entrées nouvelles possèdent tantôt un seul sens comme catarisme, tantôt plusieurs comme maquis (deux sens et un sous-sens), urbanisme (deux sens, quoique l’introduction en annonce trois à la page XXXI; le sens « branca del dret administratiu que estableix el règim jurídic, l’ús i l’aprofitament urbanístic del sòl » n’est pas retenu dans l’article). La mise à jour d’une nomenclature suppose des retraits. Ainsi, adventisme et jubé présents chez FABRA sont supprimés du nouveau répertoire.

b) Un dictionnaire général et une liste de termes — Les lexiques spécialisés ont été soignés et structurés de deux points de vue : l’augmentation de la présence des terminologies et une modélisation des unités lexicales complexes leur donnant le statut de sous-entrées. Les termes techniques et scientifiques représentent plusieurs domaines qui intéressent les utilisateurs de dictionnaires usuels. On trouvera des termes comme, entre autres, biònic, dossier, nefologia, piscolabis, pizza, programari, retrovirus, rumba, xip. Mais ce qui parait révolutionnaire dans la lexicographie de langue générale, c’est le traitement accordé aux ULC à qui on reconnait une forme d’indépendance. Elles sont enregistrées en caractères gras et systématiquement escortées d’une définition. Ainsi, l’article acer déroule successivement les ULC suivantes : acer bàsic, acer cementat, acer d’emmotllament, acer de cementadó, acer dolç, acer inoxidable, acer rapid. Le terme technique àcid occupe plus de dix colonnes de texte dans lesquelles 252 ULC sont cataloguées et définies : 250 ont àcid comme base et 2 ont àcids. De àcid abiètic à àcid xantogènic, tous les dérivés syntagmatiques de àcid sont rangés suivant l’ordre alphabétique. Les deux formes plurielles viennent en queue de classement. Cette présentation ordonnées alphabétiquement à l’intérieur d’un même sens obéit à un protocole rigoureux imposé par la démarche sémasiologique. Elle n’en permet pas moins de reconstruire un réseau terminologique onomasiologique bien maillé et arborescent. De fait, dans le DLC, toutes les unités codées acquièrent le statut de sous-entrées (voir par exemple l’article braç où on récolte 18 locutions et expressions et 13 ULC). Un certain nombre de termes techniques plus anciens ont été laissés de côté comme absintisme et autocodi.

c) Un dictionnaire de la langue commune et un vocabulaire dialectal — La fragmentation régionale et la continuité perceptibles à travers le dialectalisme et l’archaïsme ont été l’objet d’une attention profonde. Dans FABRA, les formes de ce type avaient été aménagées et ornées de marques spécifiques : d. [= dialectalisme], reg. [= régionalisme] et antic. [= archaïsme]. Ces indicatifs ont disparu de la présente édition. Ainsi, desar du baléare, esportellar du valencien et orc du parler nord-occidental sont maintenant dépourvus de notations diatopiques. Il en va de même des ajouts comme antera du parler nord-occidental, botijós du valencien et potó du baléare. Par ailleurs, des formes régionales ont été rejetées comme afondir du valencien, guiterra du baléare et mangrana du parler nord-occidental.

d) Un dictionnaire du catalan et un inventaire d’emprunts — Les langues ne vivent pas en autarcie; elles puisent abondamment au réservoir des autres systèmes linguistiques avec lesquels elles entretiennent des contacts. Le catalan compte lui aussi son cortège d’emprunts auxquels il a réservé un sort variant suivant les circonstances de temps et de lieux : anorac, ioga, multimèdia, pàrquing, xip. —Les mots pris au castillan sont traités dans une section distincte. Voir le paragraphe suivant.— Certains xénomots ont été absorbés par la langue tandis que d’autres ont conservé leur physionomie allogène. Les emprunts considérés comme parfaitement intégrés au catalan, c’est-à-dire ayant reçu un traitement grammatical et orthographique (genre, nombre, accentuation, etc.) conforme au code de la langue receveuse sont dépourvus de toute marque d’origine dans les articles. Ainsi de buquet (< français bouquet), computador (< anglais computer), escànner (< anglais scanner), esmòquing (< anglais smoking), esquaix (< anglais squash), xucrut (< allemand Sauerkrout). Certains mots importés d’autres langues ont été maintenus dans leur structure et graphie allogènes. Deux raisons peuvent expliquer la non-intégration au système catalan : l’importation est trop récente et l’incorporation ou l’accommodement ne sont pas encore commencés ou suffisamment avancés; il existe des difficultés d’intégration sur les plans phonologique, graphique, grammatical... Les lexicographes ont consigné ces unités en conservant la forme originale et sans intervenir eux-mêmes. Ils préfèrent que le temps fasse son œuvre tant en ce qui regarde la morphologie des mots —le contexte intralinguistique— qu’en ce qui a trait aux conditions extralinguistiques comme la viabilité et la durabilité des formes dans la langue. Voici quelques exemples d’emprunts intégraux anciens ou récents : apartheid, dial, fax, fondue*, kiwi, radar*, single*, suite*, whisky* (les mots suivis d’un astérisque sont étiquetés dans les articles à l’aide d’une marque indiquant la langue d’origine). Les lexicographes avancent quelques raisons pour laisser dans l’ombre un contingent d’emprunts. Par exemple, bàrman, boîte et western n’ont pas eu les honneurs nomenclaturels parce qu’on préfère attendre pour voir si les locuteurs vont les accréditer ou les rejeter. Des raisons de ce type, et particulièrement celles qui sont privilégiées pour le rejet, demeurent ténues et peu valables en raison de la fréquence d’usage des mots comme ceux qui sont cités ici (voir par exemple bàrman qui semble parfaitement intégré sur les plans graphique et accentuel).

e) Un dictionnaire de la langue pure et un répertoire de barbarismes — Les allées et venues lexicales entre le catalan et le castillan sont au centre de la question des formes fautives et des barbarismes. Les relations entre les deux langues durent depuis le XVIe siècle, au moins. Le castillan prenant le pas sur le catalan au fil des siècles, à partir du début du XXe siècle, on a vu paraitre de nombreux répertoires correctifs.

Le DLC contient des castillanismes anciens et nouveaux, l’espagnol étant la principale langue pourvoyeuse d’emprunts pour la catalan. Plusieurs unités de ce type ont été reprises des éditions antérieures. Ainsi, marfil, maroma et natilla prolongent leur carrière, tout comme mulato, pandero et patilla. Dans le dictionnaire de FABRA, les trois premiers vocables n’étaient pas identifiés comme des castillanismes alors que les trois autres étaient notés cast. Dans la présente édition, cet indicatif a été évacué. Aucun emprunt au castillan ne devrait porter la marque diaglossique cast. Pourtant quelques mots sont toujours affublés de ce label (voir armadillo).

Parmi les castillanismes nouveaux, un tri sévère a été fait afin d’éviter la prolifération des emprunts à l’espagnol. D’une part, il est quasi impossible de fermer hermétiquement la porte à l’invasion lexicale; d’autre part, il serait suicidaire pour la langue de laisser le flot se répandre indistinctement. La sélection s’est faite sur des bases discriminantes. Comme premier critère, on a repris l’hypothèse de Pompeu FABRA qui n’avait pas retenu les mots venant du castillan lorsqu’il existait un équivalent ou un synonyme en catalan. Cette règle théorique a souffert quelques entorses et des mots comme alabar et candente absents du DGLC et possédant des correspondants catalans (lloar et roent, respectivement) se sont retrouvés quand même dans le DLC, l’usage, la fréquence, l’utilité ou une quelconque autre raison l’emportant sur le statut dans ces cas. Les deux critères suivants qui ont guidé les rédacteurs sont : le critère historique, à savoir l’âge de la documentation rassemblée à l’IEC sur les mots à étudier; le critère géographique, à savoir l’extension de l’usage du mot sur le territoire catalanophone. Le critère chronologique est curieux et/ou contradictoire si l’on interprète l’expression « castillanisme nouveau » comme se référant au néologisme, autrement dit renvoyant à une unité apparue récemment dans la langue. On est situé ici sur la piste synchronique. Mais si l’on veut signifier par là qu’il s’agit d’un mot non retenu dans les éditions antérieures, l’objection tombe d’elle-même. On prend alors une piste plus diachronique. Néanmoins, on pourrait penser que les castillanismes empruntés récemment et postérieurs à la dernière édition du Fabra demeurent dans une espèce de no man’s land dictionnairique. Voici d’autres exemples de mots espagnols introduits dans le recueil : banyador (syn. vestit de bany), curar (syn. guarir), guapo (syn. bell, bonic). Par ailleurs, des mots comme alfombra (syn. catifa), nòvio (syn. promès, xicot), tonto (syn. babau, beneit) et barco (syn. vaixell) font partie des exclus.

Ces quelques paragraphes sur les applications ne sauraient se terminer sans faire état de l’introduction de mots relevant des registres populaire et vulgaire. On trouvera dans le DLC des termes appartenant à ces niveaux diastratiques comme bòfia « Vulg. Policia », cangueli « Pop. Por », clapada « Vulg. Dormida », conya « Pop. Broma », desvirgar « Pop. Desflorar (una dona) », finolis « Pop. Artificiosament ben educat, de finor amanerada », llepaculs « Vulg. Llepaire », pirar « Pop. Marxar, fugir », titola « Pop. Penis » et xona « Vulg. Vulva ». On peut se demander pourquoi dans cette démarche de désinterdiction lexicographique les termes titola et desvirgar appartiennent au niveau populaire tandis que xona est du degré vulgaire!

Le refaçonnement du dictionnaire a entrainé plusieurs retraits de formes et de sens. Certains exemples ont été mentionnés dans les paragraphes précédents. En voici quelques autres énumérés en vrac et sans caractérisation : carcamal, càrtel, càsting, corrida, esnifar, gripós, lentilla, mermelada, meublé, policial, recolzament, trola, xivar. On détectera dans cette série quelques anglicismes, quelques castillanismes et quelques mots n’appartenant plus à l’usage contemporain.

3.2.3. Les caractéristiques matérielles

Cette partie de l’introduction de A. M. BADIA illustre comment le DLC est la continuation, le prolongement de la tradition antérieure et comment il innove. Il s’inscrit nettement dans la trajectoire historique du projet dictionnairique de l’IEC. Les principales innovations qui modèlent la physionomie nouvelle du dictionnaire sont explicitées en plusieurs points.

  1. En amont du dictionnaire, il y avait au programme la constitution d’une base de données lexicales.
  2. Du point de vue de la gestion, il a fallu établir une politique lexicographique afin d’amenuiser les divergences et de favoriser l’homogénéité du travail de mise au point.
  3. En ce qui regarde la nomenclature proprement dite, il y a eu accord afin d’accroitre celle-ci particulièrement en ce qui concerne le réseau lexical des savoirs thématiques, celui des dialectalismes, celui des régionalismes, celui du secteur des emprunts, celui de quelques sphères particulières, les castillanismes, par exemple.
  4. Les définitions sont particulièrement soignées et actualisées. Elles sont souvent prolongées par des commentaires encyclopédiques ou culturels.
  5. Le système de marquage a été revu à la baisse. Plusieurs types de marques de registre utilisés dans les éditions antérieures ont été relégués aux oubliettes. Ainsi, les catégories diatopiques (dialectalisme et régionalisme) et la notation temporelle archaïsme ont été abolies.
  6. Les définitions sont rédigées de manière plus objective. On a éradiqué les éléments pouvant avoir un caractère de subjectivité, d’idéologie ou de connotation de nature politique et religieuse ou ayant des incidences sociales diverses (voir plus loin). Au surplus, les nombreux anachronismes relevés dans les exemples des éditions antérieures ont été levés.
  7. Les entrées comportant des variantes orthographiques du type darrere/darrera ont été simplifiées sur la base de l’extension d’emploi géographique du mot et au bénéfice de la forme la plus correcte du point de vue étymologique, ici darrere.
  8. Le traitement des définitions des verbes a été fignolé de manière à mieux faire ressortir la fonction des verbes transitifs. On a placé entre parenthèses les éléments signalant le complément direct afin d’éviter de gauchir la définition du verbe, de la limiter. Voici quelques exemples :
    • amarrar, sens 2 : « Lligar, fer ferm, assegurar, (un cap de corda, un cable, una cadena). »
    • capficar, sous-sens 1 : « Encorbar i colgar sota terra (una branca) a fi que posi arrels. »
    • magencar, sens 1 : « Treballar (les terres), netejar d’herba (els sembrats), pel mes de maig. »
  9. Dans les définitions des verbes nécessitant l’identification du sujet actant, le segment proprement sémantique restrictif de la définition suit la séquence distributionnelle ou la contrainte d’emploi et il en est séparé par une virgule, comme dans les exemples suivants :
    • corruquejar, sens 1 : « El colom, cantar en l’época de zel. »
    • migrar, sous-sens 1 : « Els ocells i altres animals, passar periòdicament d’una regiò o clima a un altre. »
    • palpitar, sous-sens 1 : « El cor, tenir palpitacions. »
  10. La mention etc. qui apparaissait fréquemment à la fin des définitions et nuisait à leur exactitude a été supprimée là où elle ne se justifiait plus. On évite ainsi de laisser croire que le sens est plus dilué ou plus large qu’il ne l’est en réalité.
  11. Des rectifications ont été apportées au chapitre graphique. Les signes diacritiques, notamment le tiret[3], et les signes graphiques comme le e prosthétique devant s + consonne (ex. : escànner, esquaix) ont été soigneusement étudiés.
  12. Certaines graphies ont été rectifiées en prenant appui sur le critère étymologique : eixabuirar > eixavuirar, enravenxinar-se > enrevenxinar-se, ribet > rivet.

C’est là le catalogue des principaux changements apportés dans l’opération de mise en forme des articles. Les lexicographes sont bien conscients qu’il reste beaucoup à faire dans ce domaine. Il faudrait par exemple numéroter les sens et mieux discriminer les sous-sens. La pratique du trait vertical double [‖= indicatif du début d’un nouveau sens] ou simple [| = indicatif du début d’un sous-sens] pour distinguer les différents niveaux de l’arborescence sémantique est lourde et peu efficace. C’est effectivement ici une lacune. En lexicographie contemporaine, cette procédure a été abandonnée au profit d’une numérotation à double niveau [I. → 1, 2...; II. → 1, 2...], chaque sens pouvant à son tour être l’objet de subdivisions en sous-sens identifiés grâce à un appareil diacritique : tiret [—], losange [◊], etc. De même, la réduction de la palette des marques d’usage ne permet pas de nuancer les différents degrés d’emploi, particulièrement pour les registres diastratiques.

3.2.3. L’avenir

L’introduction se termine sur l’idée que le dictionnaire est en perpétuel devenir et que son actualisation doit respecter la réalité du langage vivant. Le produit offert au public représente le premier état d’un long travail de remise à niveau. C’est incontestablement un excellent travail. La base de données textuelles en cours d’élaboration permettra une amélioration sensible du contenu du DLC. D’ici là, nul doute que les aspects proprement microstructurels bénéficieront des expériences acquises avec la mouture la plus moderne du dictionnaire du l’IEC.

3.3. L’institution et les artisans (p. XLI-XLVIII)

Ces pages sont consacrées à des listes de personnes. La première liste énumère les noms des membres de l’IEC. Elle est à jour au 30 juin 1995. Les sous-listes classent les membres par section. La deuxième liste est celle où apparaissent les noms des artisans et des collaborateurs du DLC.

3.4. Instruccions per al maneig del diccionari (p. XLIX-LV)

Sont donnés ici et assez succinctement les renseignements généraux sur la structure des entrées et des articles ainsi que les conseils favorisant un meilleur décodage.

Les entrées sont des mots pleins simples (bledar), des mots composés (bleda-rave), des acronymes (ecu, ovni, sida) et des éléments de formation préfixaux (blefaro- ou blefar-, blenno- ou blenn-) ou suffixaux (-blast, -locular, -logia). Les affixes permettent de compléter les familles lexicales dans les cas des mots facilement prédictibles. Des unités comme cassasa, gèlidament, nasset, petitó, rebò et traginable n’ont pas d’entrées pour cette raison. Voir aussi l’élément macro-/macr- qui cite quatre exemples, macròcefal, macrodont, macròpter et macròpsia; seul le premier mot revient dans la nomenclature. Les unités lexicales complexes sont entrées sous le mot principal (os bertran figure sous os, mais il y a une entrée renvoi à bertran, car cet élément n’est pas un lexème autonome; àcid carmínic apparait sous àcid, mais il y a une entrée renvoi à carmínic; bolet de soca zonat est repérable sous bolet, mais il y a une entrée renvoi à zonat, pas à soca).

Dans le cas des adjectifs variables en genre, seul l’allomorphe du féminin est repris en entrée (afrontador / -ora, afrontós / -osa, afruitat / -ada, afuadés / -issa). Cette règle change lorsque les mots sont des monosyllabes. Dans ce cas, les formes féminines sont données au long (bla / blana, blau / blava, boig / boja). Mais ce protocole n’est pas toujours respecté (base / -a, bell / -a, lat/-a). Quand ce sont les substantifs qui varient en genre, la forme féminine est présentée au long (factor / factora, fadrí / fadrina, gegant / geganta).

3.5. Llista d’abreviatures i símbols (p. LVI-LVII)

Cette liste comprend deux grands types d’abréviations : celles qui concernent le métalangage lexicographique et grammatical et celles qui sont relatives aux labels des savoirs thématiques.

4. Le texte dictionnairique (p. 1-1908)

L’architecture du DLC est bidimensionnelle, car seules la macrostructure et la microstructure ont été retenues dans le programme. Il n’y a donc pas d’iconostructure. La modélisation structurelle des articles est traditionnelle, standard. Le nombre de rubriques articulaires est relativement réduit : l’entrée (+ les variantes et les caractères morphologiques), la catégorie lexico-grammaticale, le ou les sens (du plus général au plus particulier, de la langue usuelle aux langues de spécialité), les exemples forgés. Ces quatre rubriques forment l’armature principale. De temps à autre, quelques marques d’usage et des commentaires encyclopédiques enrichissent les articles. Il n’y a pas de prononciation, ni de réseau analogique structurant (synonymie et antonymie), ni de citations littéraires ou documentaires. Les dictionnaristes ne s’expliquent d’ailleurs pas sur ces trois sujets. Pas plus qu’ils ne soufflent mot sur l’absence de l’indication de la partie du discours pour les noms; seule la catégorie grammaticale est notée (sostreta f., sotabanc m., sotabarba m. o f., suïcida m. i f). L’alternance en genre est aussi observable à travers les étiquettes m. (o f.) et f. (o m.), l’élément entre parenthèses notant une fréquence moindre. Cette pratique de ne pas mettre nom ou substantif semble poursuivre celle qu’employaient les prédécesseurs du DLC.

En général, les articles sont courts, les explications très condensées et claires. De fait, le dictionnaire illustre une grande économie de moyens afin de pouvoir diffuser le maximum d’informations sur un mot. Cette économie microstructurelle se réalise au bénéfice de la nomenclature.

L’étude de deux pages du DLC (p. 1122-1123; voir l’annexe) permet de vérifier un certain nombre de constats explicités dans les paragraphes précédents. L’échantillon réunit 67 articles de llanerol à llastrar. Il montre que nombre d’entre eux n’occupent qu’une ligne ou moins (30 articles) ou deux lignes ou moins (17 articles). Il y a donc de nombreux mots monosémiques. Aucune marque de registre de niveau de langue n’est notée dans ce segment du dictionnaire. Il faut poursuivre jusqu’à llatinida pour repérer une première marque : pop. Ce bloc d’articles illustre bien comment le système des sous-entrées est efficacement structuré. Sous llanterna, on découvre trois unités lexicales complexes : llanterna sorda, llanterna màgica et llanterna d’Aristòtil; sous llarg1 se succèdent trois locutions (al llarg, al llarg de, de llarg a llarg) et un phraséologisme (passar de llarg). Une entrée renvoi permet de récupérer une autre ULC (llarderdijous llarder V. dijous). Les définitions recourent aux deux types d’énoncés traditionnels en lexicographie, la définition substantielle (llanterna) et la définition relationnelle (llanxada). Par ailleurs, plusieurs définitions sont en réalité de simples équivalents synonymiques de l’entrée (un seul synonyme → llapa, llapissa; deux synonymes → llanut, sous-sens, llardissós) tandis que d’autres sont porteuses d’informations encyclopédiques (llanerol, llargmetratge). Les définitions amorcées par Nom donat a [...] (voir llangardaix, sous-sens 1) ou Nom de [...] (v. llapassa, sous-sens 1, llapis) sont employées assez fréquemment et elles sont généralement réservées pour décrire des éléments intégrés dans des taxinomies. La méthode de présentation des sens est un peu lourde et contraignante en raison de l’absence de numérotation. Les distinctions reposent sur un système de barres verticales : le trait double découpe les sens alors que le trait simple aide à subdiviser les sous-sens. Ainsi, llanterna possède six sens dont certains comprennent des sous-sens : sens 1 → + 3 sous-sens; sens 2 → + 2 sous-sens; sens 3; sens 4 → + 1 sous-sens; sens 5; sens 6. Cette méthode désuète rend le repérage extrêmement laborieux, même si celui-ci est atténué par le recours au caractère gras pour les sous-entrées codées.

5. Autres considérations : le non-dit

La nomenclature chiffrée du DLC n’est indiquée nulle part dans les textes prédictionnairiques. Un comptage partiel d’une cinquantaine de pages et une projection sur l’ensemble des 1908 pages prédit une nomenclature qui avoisine les 65 000 mots. Les sources documentaires journalistiques consultées s’entendent sur une nomenclature tournant autour de 80 000 entrées (voir El Pais, 27 octobre 1994, p. 34; Avui, 27 octobre 1994, p. B1; La Vanguardia, 27 octobre 1994, p. 41 — ce journal indique même un chiffre aussi précis que 82 656 entrées). Selon Avui, il n’y aurait cependant dans le dictionnaire que 66 241 « entradas directes ». Sans procéder à des calculs compliqués, il est ardu de dire si la différence entre 82K et 66K entrées provient du nombre des entrées renvois, des sous-entrées ou du décompte des sens. Toutes les sources s’entendent pour dire que l’augmentation de la nomenclature par rapport au dictionnaire de Pompeu FABRA est de l’ordre de 30 000 unités, quoique El Periódico précise qu’il s’agit de « 30.000 nuevas acepciones, que corresponden a unas 15.000 palabras » (27 octobre 1994, s.p.). Par ailleurs, l’article de La Vanguardia mentionne que la nomenclature inclut 1768 dialectalismes et 1479 emprunts. Quoi qu’il en soit, la nomenclature du DLC correspond aux chiffres que l’on possède pour les œuvres du même type élaborées dans d’autres langues.

Il a déjà été mentionné que le programme du DLC entérine la position de FABRA quant à la norme. La philosophie du dictionnaire est nettement normative et prescriptive. On y décrit une langue considérée comme la plus recevable socialement tout en adaptant le contenu de l’ouvrage à la société d’aujourd’hui. Les préjudices et les stéréotypes relatifs au sexisme, au racisme, à la religion, à la discrimination sociale ont été soigneusement étudiés et d’énormes améliorations sont constatables dans le traitement des mots idoines par rapport au DGLC de Pompeu FABRA.

Quelques exemples illustreront les progrès accomplis. La question du sexisme est perceptible sous le mot cervell (sens 2) pour lequel FABRA donnait les exemples : « El savi X és un gran cervell » et « És una dona sense cervell ». Le contraste provoqué par le rapprochement des deux fragments El savi et una dona creuse l’écart entre les deux idées opposées gran cervell et sense cervell, dont l’un renvoie à l’homme et l’autre à la femme. Le nouveau dictionnaire a supprimé ces deux exemples et les a remplacés par : « Aquella dona és un gran cervell » et « No té ni mica de cervell ». La première formulation redresse manifestement les torts. L’exemple fournit sous acarrerar (sens 2) est : « Quan algú s’acarrera al joc, és difícil que ho deixi ». Les éditions antérieures donnaient : « Quan una dona s’acarrera al vi o a beure és pitjor que l’home ». Le pôle raciste est mis en évidence dans les relents de colonialisme demeurés dans la définition du mot fetitxe dans Fabra : « Objecte natural o artificial, adorat com un ídol pels negres ». Le DLC nuance en retranchant le segment incriminant : « Objecte natural o artificial, adorat com un ídol ». Le mot culte sera pris comme phare du domaine religieux. Il élargit sa définition : « Honor que l’home tributa a Déu, a la Verge Maria i als sants » (DGLC) prend maintenant la configuration suivante : « Honor que la persona tributa a Déu o a tot allò que considera sagrat ». Les stéréotypes sociaux sont aussi corrigés. Sous amor (sens 2), la définition est mise à jour. Là où FABRA définissait le mot : « Afecció tendra i apassionada per una persona de sexe diferent », le DLC propose maintenant : « Afecció tendra i apassionada per una persona; passió sexual ». La définition de afemellat du DGLC : « Dit d’un home, d’un mascle, que sembla per la seva feblesa, delicadesa, maneres, una dona, una femella » devient dans le DLC : « Dit d’un home, d’un mascle, que sembla pel seu aspecte, per les seves maneres, etc., una dona, una femella ». Le terme cremador perd un sème pour le moins notable. FABRA le définit : « Lloc destinat a cremar-hi delinqüents, animals morts, viandes avariades, etc. », tandis que la nouvelle formulation devient : « Lloc destinat a cremar-hi animals morts, viandes avariades, escombraries, etc. ».

La féminisation du langage a nécessairement des répercussions dans les dictionnaires. Comme d’autres langues, le catalan s’adapte aux nouvelles exigences et il en est rendu compte dans le dictionnaire. Aussi constate-t-on que quelques rubriques ont vu leur schéma modifié. On a déjà signalé que dans le cas des noms désignant des personnes, la forme féminine est reprise au long à côté de la forme masculine qui demeure tête d’article (radiòleg / radiòloga, raier / raiera). En plus, les lexicographes ont régularisé l’indicatif de la catégorie grammaticale : tous les noms dénotant des titres de fonctions, de métiers, d’emploi, etc., et que cela concerne sont suivis de la double marque m. i f. Cela vaut autant pour les épicènes (arabista, periodista : DGLC m. → DLC m. i f.) que pour les unités variables morphologiquement (ministre, miraller : DGLC m. → DLC ministre ministra m. i f., miraller mirallera m. i f.). L’uniformisation touche aussi quelques cas particuliers comme mainadera : DGLC f. → DLC mainader mainadera m. i f. et cabrer m. / cabrera f. pour lesquels le DGLC avait deux articles distincts avec les définitions « Pastor de cabres » et « Pastora de cabres » | « La dona del cabrer » [...], respectivement. Le nouvel article est configuré comme ceci : cabrer cabrera m. ‖ f. Persona que guarda un ramat de cabres. ‖ f. Dona del cabrer. [...]. Les seules exceptions au double genre ont trait aux dénominations de fonction obsolètes (calesser et qüestor) ou réservées aux hommes (califa et bisbe) qui demeurent marquées du seul masculin.

Dans ces domaines sensibles et dont plusieurs frôlent des comportements reliés à des attitudes politiquement correctes et à la rectitude langagière, il est évident que de nombreux ajustements étaient prévisibles, obligatoires même. Il faut cependant éviter de tomber dans le piège de l’anachronisme et accuser Pompeu FABRA et ses collaborateurs d’avoir fait défaut en ces matières et d’avoir encouragé volontairement de tels comportements. Les remises à niveau réalisées dans le DLC montrent l’évolution de la société et celle de la langue qui n’en est que le reflet spéculaire. Ne pas avoir procédé aux changements eût été faire preuve d’insistance et d’intolérance. Heureusement, les lexicographes du DLC, et parmi le groupe de nombreuses femmes, ont su redessiner un profil modernisé de la langue catalane qui montre qu’entre le langage et la société, l’association est pérenne. Telle est la société, telle sera la langue et tel sera le dictionnaire qui sert de trait d’union entre les deux.

Annexe

Reproduction de la page 1122 du DLC. Reproduction de la page 1123 du DLC.

Notes

[1] Maria Teresa Cabré et Mercè Lorente, Els diccionaris catalans de 1940 a 1988. Barcelona, Publicacions de la Universität de Barcelona, 542 p.

[2] Institut d’estudis catalans, Diccionari de la llengua catalana, Barcelona/Palma de Mallorca/València, Enciclopèdia catalana, S.A./Edicions 62, S.A., avec la collaboration des Publicacions de l’Abadia de Montserrat, S.A., des Edicions Moll, S.A., et des Edicions 3 i 4, S.A., 1995, LVII + 1908 p.

[3] Sur cette question, voir : « L’elaboraticó del Diccionari de la llengua catalana. Criteris aprovats per la secció filològica », Institut d’estudis catalans, Documents de la secció filològica, III, coll. « Biblioteca filològica », no 30, 1996, p. 22-37. Barcelona.

Référence bibliographique

BOULANGER, Jean-Claude (1998). « La renaissance d’une langue et d’un dictionnaire. Le cas du catalan », Cahiers de lexicologie, no 72, p. 169-187. [article]

Abstract (anglais)

The article looks first at the origins of the recent dictionary of the Catalan language with a brief history of Catalan lexicography. This review of some key events that prompted the current work by the Institut d’estudis catalans provides insight into the Institut’s crucial role in language reform and national lexicographic strategy. The dictionary’s features and singularity are then examined, including a critique of the introductory texts and a description of the entry structure, with examples.