Le syntagme en informatique un projet de recherche

Jean-Claude Boulanger (Université Laval)

Dans le cadre de l’entente conclue entre l’Université Laval et la société IBM Canada, et en collaboration avec une collègue du Département de langues et linguistique, l’auteur de cet article dirige un projet de recherche qui porte sur la syntagmatique terminologique en français et en anglais dans le domaine de l’informatique. Le projet comprend deux volets : le premier consiste en l’élaboration d’une bibliographie linguistique analytique sur le phénomène du syntagme en terminologie; le second porte sur une recherche théorique et appliquée sur le même phénomène.

La constitution d’une bibliographie sur le syntagme

La terminologie ne dispose pas encore de tout l’appareillage méthodologique et théorique requis pour la conduite d’études précises dans certaines de ses régions inconnues ou encore obscures. La syntagmatique est l’une d’elles. À peine explorée et en raison de l’absence d’outils d’analyse, elle laisse maintes questions sans réponse. C’est pourquoi a été entrepris l’établissement d’une bibliographie linguistique analytique portant sur les textes traitant de la syntagmatique française et anglaise au cours des vingt dernières années, période qui commence avec les premiers écrits de Louis Guilbert sur le sujet, notamment dans sa thèse sur la formation du vocabulaire de l’aviation.

Les documents dépouillés (articles, livres, thèses, actes de rencontres scientifiques, etc.) peuvent être rédigés en français, en anglais ou dans une autre langue, du moment qu’il y est question du syntagme français ou anglais. La recherche nécessite la mise au point d’une liste de descripteurs propres au sous-secteur de la terminologie qu’est la syntagmatique générale ou comparée.

Cette partie du projet est réalisée à l’aide du logiciel BIBELO. Celui-ci est utilisé par le Centre international de recherche sur le bilinguisme pour l’établissement d’une bibliographie informatisée sur le bilinguisme et l’enseignement des langues officielles, d’où l’acronyme BIBELO. Deux étudiants sont associés à la recherche dont les premiers résultats seront publiés dans les mois à venir. A l’heure actuelle, une centaine de titres sont résumés tandis que le recensement et l’uniformisation des descripteurs s’achèvent.

La recherche théorique et appliquée sur le syntagme

On sait que le terme syntagme est polysémique (homonymique?) en linguistique et qu’il est pourvu d’une myriade de synonymes hérités d’écoles de pensée diverses, de chercheurs isolés, dispersés dans l’espace comme dans le temps. Du syntagme saussurien en passant par le syntagme chomskyen, nous sommes arrivés à la fin des années 60 au syntagme terminologique wustérien, vite réduit au terme syntagme tout court. Par ailleurs, on a recensé jusqu’à présent plusieurs dizaines de synonymes servant à désigner la notion de « syntagme », spécialement R. Kocourek qui s’est arrêté à vingt-sept dénominations sémantiquement équivalentes, en tout ou en partie, dans une étude bien connue. Il n’en demeure pas moins que malgré sa polysémie / homonymie et sa synonymie « inflationnelle », le terme syntagme est l’objet d’un large consensus dans la communauté scientifique. Tous savent le reconnaître et tous s’entendent sur la signification précise qu’il recouvre, à savoir : « groupe d’unités linguistiques syntaxiquement liées et qui fonctionnent comme une unité simple, c’est-à-dire qui sert à dénommer une seule notion, une seule réalité dans un domaine donné du savoir humain ».

Incontestablement, le syntagme est au cœur de la terminologie. Rares sont les linguistes qui l’ont examiné en profondeur. Quelques-uns, comme Benveniste (synapsie), Martinet (synthème) et Guilbert (syntagme et dérivation syntagmatique), ont senti son emprise sur la langue. Mais à l’exception du dernier, presque tous ont cantonné son étude à la langue générale, ce qui a retardé l’éclosion et la fixation de frontières précises pour ce concept en terminologie. À ce jour, il n’existe aucune recherche scientifique poussée sur les unités terminologiques complexes aux fins d’en cerner les principes théoriques et les applications pratiques dans des perspectives d’aide à la traduction et à la recherche terminographique, sans compter les incidences sur la lexicographie de la langue générale et sur les banques de terminologie. Outre les travaux de Guilbert, la seule tentative d’importance fut la Table ronde sur le découpage du terme tenue en 1978 à Montréal et dont les actes furent publiés par l’Office de la langue française en 1979.

L’analyse systématique du syntagme dans le domaine de l’informatique propose de combler en partie ces lacunes criantes.

Le projet cherchera à établir une typologie renouvelée et révisée des syntagmes pour chaque langue (l’anglais et le français). De fait, si le français possède déjà quelques pistes, il n’en va pas de même pour l’anglais pour qui le déficit est plus visible. L’étude des structures et des modes de formation des syntagmes ainsi que le démontage des mécanismes du fonctionnement syntaxique sont prévus pour chacune des langues. Puis, une analyse comparative entre les différents types français et anglais est envisagée dans une perspective nettement traductionnelle.

L’étude devrait permettre de scruter quelques problèmes spécifiques à la terminologie de l’informatique : modes de création néologique privilégiés dans ce domaine, niveaux de langue socioprofessionnels, emprunts, sigles et acronymes, marques déposées, éponymes, termes mal construits, variation linguistique, synonymie, terminologisation (c’est-à-dire installation du terme dans l’usage), signification des joncteurs syntaxiques (notamment le rôle des prépositions et des autres catégories de joncteurs), difficultés de traduction, etc., et cela tant dans la langue de Molière que dans la langue de Shakespeare.

La recherche est menée à partir de la nomenclature extraite de la banque de terminologie de la société IBM Canada, connue sous l’appellation IBMOT. Le projet n’a pas comme objectif de construire une terminologie parallèle à celles qui existent déjà et qui sont disponibles sous la forme de dictionnaires terminologiques traditionnels ou encore sous la forme de dictionnaires informatisés, comme la Banque de terminologie du Québec (BTQ), la Banque de terminologie du Canada (TERMIUM) ou celle de la Communauté économique européenne (EURODICAUTOM). Le corpus IBMOT est déjà emmagasiné sur support informatique et son degré de qualité et de fiabilité est reconnu par les spécialistes du domaine de l’informatique. La recherche aborde de plain-pied la terminologie existante répertoriée dans la minibanque.

Nous en sommes présentement à la sélection du meilleur logiciel pour le traitement des données. Il est fort probable que nous recourrons au logiciel DBaseIII+. Des essais sont tentés à l’aide d’un minicorpus d’un millier d’unités. Les premiers résultats obtenus sont satisfaisants.

Comme on décortique une formule chimique, nous autopsions le syntagme afin d’en décoder et d’en dégager les mécanismes de construction et de fonctionnement. Les retombées escomptées de ce projet de recherche devraient d’abord favoriser la rationalisation de l’utilisation de la terminologie de l’informatique pour quelque usage que ce soit : préparation de logiciels, de manuels, de programmes, etc. À partir des points de vue linguistique et traductionnel, le projet proposera des modèles de création de termes et des grilles comparatives qui permettront de découper, traiter, interpréter et analyser les syntagmes et ses constituants avec beaucoup plus d’efficacité qu’auparavant; il fixera une typologie ramenée à des structures de base simples; il fournira des indices sur la variation linguistique géographique et des informations sur les diverses interférences entre les unités terminologiques intra- ou translinguistiques.

Bibliographie

Référence bibliographique

BOULANGER, Jean-Claude (1988). « Le syntagme en informatique : un projet de recherche », Terminogramme, no 46, p. 22-23. [article]