ARCHIVED TERMIUM Plus® : Le traitement informatisé des difficultés de traduction

Archived Content

Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject to the Government of Canada Web Standards and has not been altered or updated since it was archived. Please contact us to request a format other than those available.

Consult the Pavel in ...

Silvia Pavel
Secrétariat d’État du Canada

Author’s background

Multilingual translation, journalism, university teaching in linguistics, terminology research in computer science and artificial intelligence.

Studies: MA in Oriental languages (Bucharest University) and Applied Linguistics (Ottawa University). PhD work in progress (École de Hautes Études en Sciences Sociales, Paris).

Publications: Papers on literary semiotics and narrative grammars, terminology databases, French neologisms, semantic change, term formation, terminology standards, and a series of bilingual vocabularies published in Canada and France.

Abstract

Most translation problems are either referential or linguistic: one has to understand the concepts of a particular world’s view so as to integrate them into another culture’s frame of reference before making any attempt at adequacy of the translated text to the natural setting of the target language.

Many such problems are encountered by translators working for the Canadian governent, especially when dealing with LSP texts. Their main problem-solving aid besides their LSP knowledge is the TERMIUM bank, an electronic database of over one million entries that is systematically updated by terminologists doing research in twenty two specialized fields.

The paper discusses some of these translation problems, the methods used to solve them via TERMIUM, and the practical improvements considered at the Terminology and Linguistic Services Directorate in this area.

Une des idées le mieux reçues dans les milieux traductionnels est que l’acte de traduire englobe les opérations d’analyse, d’extraction, de synthèse, de recomposition et de réécriture (Gouadec : 1989), que les problèmes à résoudre sont d’ordre référentiel et linguistique : se représenter le monde évoqué dans le texte de départ en termes événementiels (qui fait quoi, à qui, comment, où, pourquoi) et visualiser le texte d’arrivée (précision terminologique, authenticité phraséologique, cohérence rhétorique/rédactionnelle).

Certains pensent que l’équivalence exacte est rarement possible en traduction, ne serait-ce que parce que les langues ont des grammaires différentes, un nombre inégal de mots, des découpages spécifiques de la réalité (Newmark : 1991); et que l’équivalence textuelle est une question de degré, mesurable d’abord par l’effet du message sur les récepteurs en langue source et en langue cible, et seulement ensuite par l’identité formelle entre les propriétés de ses unités constitutives.

D’autres estiment que la vraie difficulté n’est pas de substituer un ensemble de stéréotypies langagières à un autre mais de rendre adéquatement l’expression personnelle d’une pensée originale; que le concept même de difficulté de traduction est éminemment subjectif et cognitif puisque perpétuellement modulé par les connaissances du monde, les états d’esprit et les compétences linguistiques de l’auteur d’un texte, de son traducteur et du récepteur¹.

Sans doute, la vraisemblance de ces considérations varie–t–elle sensiblement selon les critères et le contexte de l’évaluation. Dans ce qui suit, elles serviront de repères autour desquels s’articulera une réflexion sur la traduction vécue comme pratique sociale d’une administration bilingue. Plus particulièrement, nous examinerons quelques-unes des difficultés couramment rencontrées en traduisant, la façon dont on peut les surmonter à l’aide de la banque de données linguistiques du gouvernement canadien, et nous présenterons les solutions méthodologiques étudiées à la Direction de la terminologie et des services linguistiques (DTSL) en vue d’en améliorer le traitement.

Langue générale et langue de spécialité

Rappelons, pour mieux nous situer, que le Secrétariat d’État du Canada emploie plusieurs centaines de traducteurs généralistes et spécialisés. Leurs compétences linguistiques sont évaluées au moyen de l’examen d’admission, de concours de promotion, et d’évaluations annuelles. L’homogénéité de leurs performances est maintenue par un vaste programme de cours de formation et d’ateliers de perfectionnement. L’anglais est le plus souvent la langue de départ (LD) avec le français comme langue cible (LC).

Les textes à traduire relèvent de tous les domaines d’activité mais la demande la plus forte est enregistrée en administration, économie, droit, finances, environnement, industrie et commerce, technosciences de pointe. Parmi les domaines à faible demande, on compte les arts et l’artisanat. Quant au volume des textes traduits, le Bureau produit l’équivalent d’une bible et demie par jour dont la moitié est fournie par des contractuels.

Dans ce contexte, l’acte de traduction englobe tant la langue générale, courante, commune (LG) que la langue de spécialité (LS). Nous définissons LS comme un sous-ensemble de LG, circonscrit par un domaine spécifique du savoir, se prêtant à une systématisation conceptuelle propre (réseau notionnel) et à une organisation lexicale relativement autonome (terminologie particulière, phraséologie caractéristique), mais respectant la morphosyntaxe LG et récupérant une partie de son vocabulaire.

Bien entendu, chaque spécialité a sa propre LS mais le flou des frontières entre domaines, l’évolution et la migration des concepts créent des zones grises entre les LS et leurs langue générale – aussi bien qu’entre plusieurs LS – où divers degrés de spécialisation coexistent avec la banalisation graduelle de certains termes et l’apparition de nouvelles LS pour les spécialités émergentes.

Toute LS peut être considérée du point de vue du rédacteur d’un texte spécialisé, de l’expert ou de l’étudiant d’une discipline donnée, de l’enseignant de cette discipline, du terminologue qui en étudie le vocabulaire et, plus récemment, du point de vue de l’ingénieur cogniticien qui formalise les connaissances d’un domaine pour en construire un système expert. Le point de vue du traducteur présuppose l’étude comparée des LS en contact et présente un intérêt certain pour la recherche en traduction automatique. En abordant la problématique LS sous l’angle du transfert interlangues nous espérons en suggérer des solutions intéressantes à plusieurs points de vue.

Les difficultés de traduction

Exercice intellectuel qui sollicite l’intuition et la créativité, l’acte de traduire implique aussi des raisonnements que l’on peut formaliser et des décisions que l’on peut anticiper. Il exige une connaissance de conventions linguistiques et culturelles explicites que l’on peut évaluer qualitativement et quantitativement sur des résultats tangibles et selon des critères déterminés. Le voir accompli simultanément par des centaines de personnes, au même endroit et dans les mêmes buts, depuis un demi-siècle, permet d’identifier avec une certaine précision (voir Williams : 1989) les facteurs qui contribuent et ceux qui nuisent à son déroulement optimal dans un tel contexte.

Les difficultés typiques dont il sera question plus loin sont extraites des évaluations de la qualité des textes traduits effectuées à la Direction des services linguistiques, des questions adressées au service de consultations linguistiques et terminologiques, des 26 000 fiches que les traducteurs ont versées aux fichiers linguistiques de la banque TERMIUM. Les publications consacrées aux problèmes de traduction en font d’ailleurs souvent état. La nature de ces difficultés est translinguistique mais elles peuvent se matérialiser différemment d’une langue à l’autre.

Visualisation du monde évoqué dans le texte de départ

Concepts et reseaux. À la différence du spécialiste dont la compréhension d’un concept LS est consciemment décompositionnelle et logique, le traducteur vise plutôt une compréhension holiste, fonctionnelle des concepts véhiculés dans le texte à traduire. Il s’intéresse surtout aux éléments qui lui permettent de distinguer les thèmes (non concepts) portant sur des objets particuliers (concepts) et encadrés par des circonstances spécifiques. Cette « synthèse interprétative... prend appui sur une unité-document globalisée et non sur des empilages de sous-unités. Elle s’organise... en fonction d’un projet global emboîtant, dans l’ordre, les cadres génériques (lieu, langue, moment, domaine, secteur), les cadres de destinations (nature du public et fonctions du document) et les cadres typologiques (type du document second) » (Gouadec : 1989).

En même temps, la connaissance des éléments logiques universels du discours (agent, co-agent, patient, instrument; prédicats d’action, d’état, d’événement, de manière, de lieu, etc.) peut aider le traducteur à se représenter la dynamique narrative du texte à traduire – ce que les concepts/objets font, subissent ou deviennent (séries d’actions, de présuppositions, champs sémantiques).

Ce type de représentation basée sur les universaux de la cognition² s’apparente d’ailleurs aux cadres, schémas et scénarios utilisés en intelligence artificielle pour la formalisation des connaissances, et aux grammaires construites en traduction automatique (grammaire universelle, grammaire des cas, réseaux sémantiques et associatifs, dépendances conceptuelles et fonctionnelles) selon des modèles de raisonnement humain décrits en psychologie et en linguistique cognitives.

S’inspirant d’une telle représentation, Kukulska-Hulme (1990:22) propose un nouveau type de dictionnaire, axé sur les actions et les acteurs, qui permette au traducteur de reconstruire une image cohérente du monde évoqué dans le texte de départ à partir de ses éléments constitutifs et de leurs combinaisons. Les éléments de son dictionnaire, extraits d’un texte en informatique, sont des acteurs/objets (bloc, caractère cellule), des actions (copier, déplacer, saisir), des propriétés d’acteurs (actif, numérique, libre) et des propriétés d’actions (automatique, partiel, multiple). Les combinaisons illustrant son analyse sont :

acteurs + propriétés (cellule : active, courante, vide)

propriétés + acteurs (active : cellule, feuille, format)

acteurs + actions (cellule : pointer, saisir, protéger)

actions + acteurs (pointer : cellule, bloc de cellule)

actions + propriétés (cadrage : à gauche, à droite)

propriétés + actions (verticale : recherche, évaluation)

La première tentative d’une telle systématisation est souvent lacunaire car le texte de départ contient rarement toute l’information indispensable au traducteur pour comprendre et se représenter mentalement le contenu du message à traduire. L’information disponible est fragmentée, elliptique, éparpillée dans le texte, parfois implicite, d’autres fois – inaccessible, comme dans les acronymes inexpliqués. Avant de pouvoir identifier les concepts propres au domaine parmi tous les concepts véhiculés dans le texte et se faire une idée de leurs relations,le traducteur doit passer cette information par le filtre de sa propre réflexion et en consultant les meilleures sources spécialisée à sa disposition.

Le traducteur cherche des précisions dans des ouvrages ou dictionnaires spécialisés, dans les banques de données terminologiques et, pour les concepts difficiles à cerner, auprès des spécialistes ou directement chez l’auteur du texte. Or à l’heure actuelle, les sources écrites n’envisagent pas les concepts dans la perspective opératoire des acteurs-actions-propriétés, ou tout au moins, pas de manière systématique. La description des concepts ne fait pas ressortir les réseaux associatifs qui relient leurs sens. Les définitions énumèrent les traits distinctifs des concepts tels que retenus au moment de la rédaction sans décrire leurs fonctions et leur évolution.

Concepts verbaux. Les vocabulaires LS définissent presque exclusivement des concepts-entités, normalement désignés par des noms ou des syntagmes nominaux. Les concepts verbaux, désignés par des verbes ou des syntagmes verbaux le sont rarement, ou alors ils sont pris dans leurs sens LG de sorte que le sens spécialisé échappe au traducteur. En consultant un dictionnaire informatique, il n’apprendra pas que l’on peut dire « activer/désactiver une règle, une procédure ou un programme » ni qu’il est encore mieux de dire « appliquer ou déclencher une règle », « invoquer une procédure » et « appeler ou démarrer un programme »; il n’apprendra non plus qu’un algorithme « se déroule » et « se termine » lorsqu’il a « engendré ou généré une solution » ou lorsqu’il « aboutit à un résultat » (Pavel : 1989).

Il est vrai que les langues romanes, slaves et germaniques, qu’elles soient générales ou de spécialité, ont moins de verbes que de noms et que la polysémie des verbes est très riche. Cela ne signifie pourtant pas que les verbes ne désignent pas des concepts, ni que les concepts qu’ils désignent tiennent tous de la langue générale. Le traducteur doit d’abord identifier les concepts verbaux d’importation LG et ceux qui sont spécifiques à la langue de spécialité ou à un ensemble de telles langues. Au plan du discours, il doit distinguer les combinaisons syntagmatiques libres des combinaisons fixes ou lexicalisées (unités terminologiques) et des combinaisons à commutativité restreinte (phraséologismes).

Le fait de savoir que la spécificité peut être marquée par les relations entre les concepts verbaux d’un domaine, par des emplois transitifs, intransitifs ou réflexifs particuliers, par les prépositions introduisant le syntagme verbal et par les collocateurs³ du verbe dans la phrase (par exemple, en tournage des métaux : "set over the tailstock – désaxer la contrepointe", "touch up a tool – paraffûter l’arête tranchante d’un outil") peut guider le choix d’un équivalent acceptable en langue cible, mais cela ne garantit pas le choix de l’équivalent réellement véhiculé.

Il est donc hautement souhaitable de répertorier et d’étudier systématiquement les verbes et syntagmes verbaux par langues de spécialité d’autant plus que leur structure sémantique diffère de celle des noms (Fellbaum : 1990). La pertinence LS des concepts verbaux ressortirait avec éclat. Les études de H. Picht (1987, 1990) dans cette voie le démontrent d’ailleurs déjà. Quant aux modalités de représentation formelle des verbes LS dans les banques de données terminologiques, on pourrait s’inspirer des travaux de Kukulska-Hulme (1990) et des recherches lexicographiques en cours à l’université Princeton sur la base de données WordNet (Miller : 1990).

Propriétés distinctives. À l’intérieur d’un domaine, les concepts génériques engendrent des concepts spécifiques par modulation, modification ou qualification. Cet aspect universel du langage se réalise différemment dans diverses langues. En anglais et en français, les concepts-entités sont le plus souvent spécifiés par des adjectifs, et les concepts verbaux, par des adverbes. Un troisième moyen de qualification, commun aux deux classes de concepts, est le syntagme prépositionnel. Identifier les manifestations textuelles de ces procédés et les répertorier dans les dictionnaires faciliterait la compréhension du réseau conceptuel LS et donnerait une image plus complète et plus systématique de son vocabulaire.

Modèles et analogies. Dans les ouvrages spécialisés, les concepts sont souvent décrits au moyen d’analogies, d’images ou de modèles conventionnels qui permettent de comprendre l’expérience d’un domaine peu connu en y projetant l’expérience d’un domaine mieux connu. Ces projections conceptuelles ne sont pas des figures de style mais des modes de pensée, d’acquisition et de création de connaissances qui s’organisent en systèmes cohérents et qui déterminent le profil terminologique du domaine d’accueil. En intelligence artificielle par exemple, la description du cerveau comme « théâtre de représentations mentales » a généré toute une série de néologismes sémantiques dérivés de cette analogie (scènes et rôles thématiques, cadres, acteurs, décors et accessoires) qui désignent les éléments de ces représentations (Pavel : 1989).

Faire référence à ces analogies dans les définitions des vocabulaires spécialisés aiderait le traducteur à distinguer entre les « images invariantes » (Brugman, Turner : 1990) d’un ou de plusieurs domaines, les significations nécessairement variables selon les points de vue adoptés à l’intérieur d’un seul domaine, et les désignations métaphoriques dont la traduisibilité et l’acceptabilité peuvent varier d’une langue à l’autre⁴.

Le transfert : conventions, régularités et particularités

Designations conventionnelles. Pour construire le texte-cible à partir d’une grammaire et d’un dictionnaire actions-acteurs, il faut d’abord trouver les désignations correspondant aux unités identifiées (terminologies normalisées, recommandées ou reconnues, noms d’organismes, traductions officielles de titres, acronymes et appellations) de manière à « respecter toutes les conventions régissant les stéréotypies de formulation-organisation à l’intérieur du type de texte ou de document retenu, de prendre en compte les mécanismes interprétatifs mis en oeuvre, ou susceptibles de l’être, par le lecteur » (Gouadec : 1989).

Or ce type de connaissance n’est pas toujours disponible. Dans les domaines techniques, par exemple, l’emploi des synonymes est réglé par des conventions d’usage que les sources consultées peuvent ne pas mentionner. Les normes terminologiques internationales et nationales élaborées dans un domaine donné ne coïncident pas nécessairement. La variation croît avec les normes d’entreprise ou d’une administration particulière. Des désignations synonymes varient d’un texte LS à l’autre en fonction de l’aire géographique, du niveau de langue ou du niveau de généralité visé. A l’intérieur du même texte, l’emploi des synonymes est dicté par des conventions stylistiques et grammaticales (Lehrer : 1990) inconnues du novice et acquises par le traducteur expérimenté au prix de maints tâtonnements.

Régularités et idiosyncrasies phrastiques. Il faut ensuite connaître les solidarités lexicales dans la phrase LS. Accéder à ce type d’information pose le plus de problèmes au traducteur parce qu’elles diffèrent des combinatoires connues en LG, parce qu’elles ne sont pas suffisamment étudiées et surtout parce que les vocabulaires spécialisés tant bilingues qu’unilingues ne les répertorient pas. Ici encore, on constate l’utilité de donner une dimension phraséologique aux méthodes de repérage, d’analyse et de consignation des données terminologiques et linguistiques dans les sources bilingues normalement consultées par le traducteur. En terminologie, elles présentent un intérêt particulier parce qu’en les analysant on peut mieux comprendre les origines et les étapes successives de la terminologisation formelle et sémantique.

Régularités et particularités lexicogéniques. En langue générale, la polysémie et l’homonymie sont reconnues comme parties intégrantes du système lexical. Même si les linguistes ne s’accordent pas toujours sur leur définition, on les distingue le plus souvent par la présence ou l’absence de liens sémantiques étroits. La polysémie réside dans l’identité de formes lexicales désignant des concepts qui partagent plusieurs attributs. L’homonymie se limite à l’identité accidentelle de forme là où les sens diffèrent. Les dictionnaires de langue consignent les régularités et les idiosyncrasies lexicogéniques de ces phénomènes touchant à toutes les catégories grammaticales, et les grammaires en enseignent l’usage conventionnel.

En langue de spécialité et tout particulièrement en terminologie, ce sont des sujets délicats parce qu’ils démontrent le caractère illusoire (Budin : 1990, Draskau : 1991) de l’idéal de monosémie. L’aménagement terminologique au profit de la monosémie peut d’ailleurs prendre des formes extrêmes. Ainsi, lorsqu’un terme a des sens apparentés par analogie dans deux domaines (« virus », « rétrovirus », « vaccin », en épidémiologie et en sécurité informatique) on en fait des termes homonymes (au même titre que « avions » dans « nous avions des avions »); lorsque la même forme lexicale renvoie à plusieurs catégories grammaticales, l’on parle aussi d’homonymes (p. ex. l’adjectif « algorithmique » et le nom féminin « algorithmique » désignant une discipline mathématique); et lorsqu’un terme nouveau développe plusieurs acceptions dérivées par métonymie ou synecdoque à l’intérieur du même domaine (p. ex. « interpréteur » – langage de programmation, programme conçu en un tel langage, et composante matérielle de l’ordinateur qui le supporte; « intégrateur » – opérateur d’un programme d’intégration et en même temps le programme lui-même), l’on préfère adopter une désignation pour chaque acception « pour éviter la confusion ». Résultat : la motivation du changement sémantique, les transformations qui régissent l’acquisition de nouveaux sens spécialisés à partir de sens centraux sont occultées.

Encourager la réflexion terminologique sur la polysémie dans les spécialités et sur une méthode de description adéquate dans les vocabulaires LS facilitera sans doute le travail du traducteur. On pourrait, par exemple, commencer par étudier l’applicabilité des régularités de la polysémie LG (Norrick, Nunberg, Apresjan, Atkins) aux langues de spécialité, en identifier les contraintes et les idiosyncrasies en LS et les répertorier systématiquement dans les vocabulaires bilingues spécialisés.

Ces régularités et particularités ont déjà été démontrées de manière ponctuelle durant les vingt dernières années (Goffin, Lehrer) dans des spécialités comme la chimie ou la physique (la polysémie du terme « atome » mérite à elle seule un article d’encyclopédie) et jusque dans les taxinomies botaniques et zoologiques, mais aucune école terminologique n’en a introduit sérieusement l’étude dans sa méthode de recherche. Or leur connaissance éclairerait le traducteur sur le fonctionnement de la néologie sémantique et lui permettrait d’en identifier les manifestations textuelles.

Dans une moindre mesure, le traducteur doit connaître ou avoir accès aux éléments et procédés de création néologique formelle pour chacune des langues en contact, ainsi qu’aux contraintes contextuelles de leur application LS. Les universaux cognitifs de la pensée créatrice (Boden : 1990) sont encore peu connus en terminologie et en traduction, tout comme ceux de la créativité de désignation d’ailleurs (Mermin : 1990). Le traducteur doit se baser sur sa propre intuition et créativité pour saisir la motivation des néologismes formels en langue source et les exprimer adéquatement en langue cible. Bien entendu, la connaissance de ces principes universels et des procédés lexicogéniques les plus productifs dans chacune des langues de travail lui facilite la résolution de maints problèmes traductionnels.

La visualisation du texte-cible

À cette étape, le traducteur doit résoudre surtout des problèmes de langue, qui exigent une bonne connaissance de la grammaire, du bon usage et du style en langue cible. Il lui faudra détecter et éliminer les redondances ou résidus traductionnels ou bien fournir des explications (notes du traducteur). Que sa traduction soit littérale ou libre, il devra éviter d’exagérer les différences entre les deux langues lorsque l’idée peut être exprimée par des mots et structures semblables, et inversement, éviter l’excès de fidélité à la langue source qui bouleverse inutilement les modes d’expression en langue cible.

L’efficacité de communication « commande d’utiliser toute approche nécessaire pour ‘mobiliser’ le lecteur... d’exclure tout élément susceptible de bloquer la lecture ou tout élément de contenu ou de forme superflu ou inutilement redondant... de respecter les principes de ‘logique universelle’ et les règles de la ‘grammaire technique’ concernée, de baliser clairement le trajet de la lecture » (Gouadec :1989). Ce sont là autant de questions de rédaction qu’on se contente ici de mentionner.

La banque de données linguistiques TERMIUM

Dans ce qui suit, nous tenterons de montrer dans quelle mesure TERMIUM contribue à la solution des difficultés discutées plus haut, quelles sont les difficultés insuffisamment traitées et quels changements de structure et de traitement des données sont envisagés pour en améliorer la performance.

La banque de données linguistiques TERMIUM a été conçue pour faciliter la communication dans les deux langues officielles du Canada et pour fournir aux traducteurs non seulement l’information des dictionnaires courants mais aussi celle qui ne s’y trouve pas toujours. Elle est devenue le principal outil de travail des traducteurs du gouvernement canadien non seulement parce qu’ils y accèdent en ligne à partir de terminaux, sur disque optique à partir des lecteurs de disques, et très bientôt à partir du micro intégré au poste de travail du traducteur, mais aussi parce qu’ils peuvent contribuer à son alimentation en y stockant leurs solutions aux difficultés rencontrées en traduisant, pour le bien commun de ses utilisateurs.

TERMIUM réunit une base de données terminologiques, une base de données documentaires, un fichier d’appellations et un fichier linguistique (difficultés de traduction et problèmes de langue). Chacune de ses composantes fournit des solutions à des catégories prédéterminées de difficultés. La nature des données varie selon le fichier, mais la structure générale des fiches TERMIUM est unique et d’ailleurs semblable au format MICRO-MATER proposé pour les échanges inter-banques.

Par exemple, sur les fiches « appellations », « difficultés de traduction » et « problèmes de langue », tous les types de justification (définition, contextes, exemples, observations) sont regroupés sous l’identificateur OBS, tandis que les fiches terminologiques ont des identificateurs séparés pour chaque type de justification. Ce format semble toutefois moins adéquat pour le traitement des problèmes de langue, souvent unilingues. Les services linguistiques de la DTSL envisagent la création d’une base de données autonome disponible sur microordinateur, qui soit mieux adaptée au stockage et à la dissémination de ce type d’informations.

D’une part, le fichier « difficultés de traduction » est un simple répertoire d’environ 17 000 solutions personnelles signalées par les traducteurs auxquelles s’ajoutent environ 9 000 « problèmes de langue ». On y trouve des locutions, des proverbes, et des collocations sans distinction entre langue générale et langue de spécialité. Son contenu hétéroclite et répétitif ne s’articule pas sur une typologie des difficultés qui permette le classement et la gestion systématique des données. Il y a d’ailleurs une bonne raison à cela. Il a été créé il y a quelques années pour servir précisément de corpus d’analyse à l’élaboration d’une méthode de traitement informatique de ce type de données et il constitue aujourd’hui un des points de référence indispensables à la réflexion méthodologique qui vise sa refonte. Nous y reviendrons.

D’autre part, la base de données terminologiques contient près d’un million d’entrées bilingues relevant de vingt-deux grands domaines spécialisés, divisés en sections et sous-sections.

L’appartenance d’une notion à un ou à plusieurs domaines est indiquée sur chaque fiche. Dans chaque domaine, la terminologie afférente est regroupée sur des fiches notionnelles bilingues et accompagnée de renseignements sur la notion étudiée (définition de type décompositionnel et/ou opératoire), ses désignations en français et en anglais (termes, synonymes, variantes, abréviations), des marques d’usage, des contextes ou exemples d’emploi, les sources de ces informations, et des observations sur les différences du découpage notionnel dans les deux langues. Rien n’interdit d’inclure dans ces observations des notes sur les particularités lexicales, phraséologiques ou morphosyntaxiques des unités traitées et des renvois aux entrées d’autres fiches, ni de signaler des relations et des associations conceptuelles spécifiques au domaine étudié ou de prévenir contre des erreurs d’interprétation possibles.

Chaque demi-fiche contient aussi un champ appelé « terme clé » qui permet de multiplier au besoin les chances d’accès aux données sur fiche. Ce champ ne sert toutefois pas à renvoyer à des notions et/ou termes apparentés de nature à placer la notion en question dans une structure conceptuelle plus générale. Le champ facultatif « document graphique » donne accès à des schémas, dessins, tableaux ou diagrammes illustrant la notion, tandis que le champ « dossier de synthèse » peut contenir des précisions sur des définitions contradictoires, des usages contestés, des études menant à la création d’un néologisme, ou des raisons justifiant la normalisation ou l’uniformisation d’un terme particulier. Toutefois, dans la mesure du possible, tous les renseignements indispensables à la compréhension d’un concept figurent en champ « justification ».

L’approche comparatiste de la recherche terminologique préalable à la systématisation des données sur fiches TERMIUM se reflète dans l’importance accordée au recoupement des justifications (crochet terminologique) fournies à l’utilisateur. En principe, la recherche comparée vise un triple but : cerner le sens au moyen de traits distinctifs, justifier l’équivalence entre les désignations du concept défini, et renseigner sur l’emploi correct des termes en vedette dans la phrase LS tant en langue source qu’en langue cible.

En pratique, la recherche se concentre sur le recoupement des traits sémantiques distinctifs et des relations hiérarchiques entre notions⁵ sans référence aux réseaux associatifs. L’analyse des corpus de dépouillement est axée sur les unités nominales, les liens fonctionnels et les champs sémantiques ne sont pas soulignés systématiquement au moyen de renvois croisés, l’emploi des termes dans la phrase est rarement illustré autrement que par quelques contextes cités et leur comportement dans l’intertexte du domaine ne l’est pas du tout. Or ces aspects posent des problèmes non seulement aux traducteurs, comme on vient de le voir, mais aussi aux rédacteurs de textes techniques, et aux enseignants/étudiants de LS.

Améliorations envisagées

Pour les gestionnaires de TERMIUM qui, depuis plusieurs années déjà, constatent tant l’interdépendance entre terminologie, phraséologie et lexicographie que l’utilité pour le traducteur d’accéder simultanément par ordinateur à ces trois types de renseignements, la question est de savoir comment intégrer la dimension relationnelle, fonctionnelle et phraséologique aux diverses étapes de la recherche terminologique informatisée en commençant avec l’analyse des notions jusqu’à la consignation des données. Cette question se pose donc en termes de méthode de recherche, d’organisation des fichiers, des données et des clés d’accès aux fiches, mais aussi en termes de formation théorique et de perfectionnement professionnel des terminologues et des traducteurs.

Méthodes de recherche. Compte tenu des acquis théoriques récents en linguistique cognitive, en organisation des connaissances et en phraséologie, nous comptons multiplier les projets pilotes qui adoptent les analyses combinatoires de type actions-acteurs comme complément de la recherche notionnelle de type décompositionnel afin de diversifier les options méthodologiques pratiquées à la Direction de la terminologie et des services linguistiques.

Après une première expérience dans le domaine de l’intelligence artificielle (Pavel : 1989), plusieurs études de cas seront entreprises cette année sur des concepts abstraits et nouveaux en sciences sociales tels « abus » et « empowerment » (Rondina : 1993) véhiculés dans les textes bilingues du Bureau de la traduction.

Un autre projet en cours porte sur un vocabulaire combinatoire de la conception et fabrication assistées par ordinateur (Lainé : 1993). Ce vocabulaire bilingue devrait recenser quelque 200 termes accompagnés de leurs cooccurrents les plus fréquents relevés dans les monographies et articles dépouillés.

La pertinence des recherches phraséologiques pour la définition des concepts évolutifs et des néologismes technoscientifiques sera évaluée dans le cadre du projet Vocabulaire des fractales (Pavel & Boileau : 1993). Ce projet accorde une attention particulière aux définitions de type analogique et opératoire, ainsi qu’aux verbes et à leurs collocateurs selon la combinatoire actions-acteurs-propriétés.

Les verbes y seront étudiés d’abord en fonction des catégories et des relations verbales adoptées pour la base de données lexicographiques WordNet et leur degré de spécialisation sera déterminé ensuite par l’écart de leur configuration sémantique en LG. La typologie des changements sémantiques perçus tiendra compte des marques syntaxiques qui les signalent : catégories d’acteurs solidaires du verbe, choix particulier des prépositions, formes transitives, intransitives ou réflexives, et des relations factitives, d’opposition et d’implication stricte, qui regroupent les verbes. Le but de l’exercice sera de fournir une première représentation sémantique du réseau verbal dans ce domaine afin d’en évaluer l’applicabilité sur des ensembles verbaux dans d’autres LS.

Organisation des fichiers TERMIUM : données et clés d’accès. La structure actuelle de la base de données terminologiques est parfaitement adaptée pour permettre la consignation des nouvelles données. Le type de justification DEF admet aussi bien les définitions par traits distinctifs que les définitions par analogie et opératoires. Dans les justifications CONT, on peut déjà inclure plus d’un contexte par fiche.

Par contre, les « exemples d’utilisation » (EX) et « observations » (OBS) pourraient accepter au besoin plus de données phraséologiques et sémantiques. Les premiers pourraient regrouper à titre d’illustration les collocateurs du noyau en vedette ordonnés selon, par exemple, le modèle proposé dans le « Dictionnaire actions-acteurs pour l’informatique » (Kukulska-Hulme : 1990) ou celui adopté dans le Lexique des cooccurrents – bourse (Cohen : 1986); les seconds pourraient inclure des références à d’autres concepts ou à l’évolution du concept traité et des remarques d’ordre linguistique. Leur présentation physique sera déterminée en fonction des résultats des projets pilotes.

Vraisemblablement, ces travaux justifieront l’adoption de règles plus flexibles et plus englobantes quant à l’utilisation des termes clés et des dossiers de synthèse. Ces derniers, tout comme les « documents graphiques », pourraient, par exemple, servir à illustrer la place de la notion analysée dans une représentation des concepts du domaine sous forme de listes, arbres et réseaux associatifs. Il ne faudra toutefois pas perdre de vue le fait que les fiches étant bilingues, elles doivent rester simples et concises tout en permettant l’accès, sur demande, aux détails fournis dans les dossiers de synthèse à l’intention d’un nombre restreint d’utilisateurs.

Les locutions, les proverbes et les collocations usuelles en LG apparaîtront dans le fichier qui leur est actuellement réservé. Le fichier traductionnel n’étant pas uninotionnel, une même fiche pourrait regrouper les renseignements selon la formule adoptée par le BBI Combinatory Dictionary of Enqlish (Benson et al. : 1986) tout en fournissant la contrepartie dans la langue cible sur l’autre demi-fiche. L’applicabilité d’autres formules sera étudiée avant la préparation d’un guide de rédaction à l’intention des traducteurs qui désireront contribuer à l’alimentation de ce fichier.

La gestion de ce fichier incombe aux services linguistiques de la DTSL qui étudient la structure à adopter tant pour les « difficultés de traduction » que pour les « problèmes de langue ». Bien entendu, les décisions relatives aux méthodes de recherche et de consignation ne seront prises qu’après consultation des terminologues et des traducteurs. Les changements viseront une plus grande cohérence des données LG, la diversification des possibilités d’accès à ces données et l’homogénéité de structure et de présentation des informations en langue de spécialité et en langue générale.

Formation et perfectionnement professionnels. Cette activité consistera en la rédaction et la diffusion de documents méthodologiques et de guides pratiques exposant les changements apportés au traitement informatisé des données terminologiques dans une perspective phraséologique, qui seront étudiés lors des séances de formation et des ateliers de perfectionnement organisés sur une base régulière à l’intention des terminologues et des traducteurs.

Pour les terminologues, on envisage la préparation de documents théoriques et de séances d’information sur des thèmes d’actualité dans la profession tels l’organisation de connaissances, les rapports entre terminologie et lexicographie, la place de la terminologie en langue de spécialité, les régularités de la polysémie, et les procédés lexicogéniques caractéristiques du vocabulaire technoscientifique.

Conclusion

Les activités en cours et la réflexion amorcée à la DTSL sur le traitement informatisé des difficultés de traduction n’impliquent nullement l’abandon des acquis méthodologiques de la recherche terminologique classique mais bien leur enrichissement, leur actualisation. Elle visent la diversification des compétences linguistiques des traducteurs et des connaissances lexicographiques des terminologues, de leurs options de recherche et de consignation des données compte tenu des exigences professionnelles des utilisateurs de TERMIUM.

Notes

Dans ce trio, le traducteur se place au niveau de la métaconnaissance linguistique : il a des connaissances sur les connaissances de l’émetteur et du récepteur, et il peut distinguer les découpages de la réalité qu’ils partagent de ceux qu’ils ne partagent pas : "Knowledge of word meanings, knowledge of what the world is like, and knowledge of possible communicative intentions, all contribute simultaneously to the ‘picture of the world’ we get when we interpret a text... A notion of ‘contrastive pragmatics’ makes sense if for different languages either distinct conventions exist for ‘reading between the lines’, or if special and distinct pragmatic purposes have linguistic means dedicated to them in different languages" (Fillmore : 1984, p. 126).
Actions, perceptions et conceptions saisies en termes de temps, états, changements, causes, buts, quantités et catégories, sont exprimées à leur tour en termes spatiaux de trajet, contact, espace clos, direction, mouvement (Turner : 1990). Le « concept » a ici le sens « objet abstrait de la connaissance » et est synonyme de « notion ».
Les termes « collocation » et « collocateur » sont pris ici dans le sens de Kjaer et Picht : solidarité d’éléments linguistiques autour d’un noyau à commutabilité restreinte, qui fonctionne comme une expression figée sans nécessairement être lexicalisée. En langue de spécialité, le noyau est une unité terminologique simple ou complexe, nominale ou verbale. La « phraséologie LS » est la discipline qui étudie ces collocations, leurs liens syntaxiques, leurs relations et les modifications sémantiques des éléments qui entrent en combinaison avec un noyau terminologique.
« L’analyse des théories prouve qu’il n’y a pas de langage d’observation indépendant des faits. Les faits expérimentaux sont lourds de... présupposés et d’hypothèses qui tiennent par mille liens à l’ensemble des théories dans lesquelles ils s’insèrent, théories qui constituent un arrière-fond sédimenté à partir duquel seulement les faits reçoivent leur signification. Les significations ne peuvent être invariantes d’une théorie à l’autre. Il faut accepter la présence de glissements de sens, d’analogies et de métaphores. Lorsque l’on passe d’une théorie à une autre, il n’y a pas conservation de la sémantique, mais modifications, aussi bien de la sémantique référentielle (entités) que de la sémantique connotative (propriétés) » (Molino : 1979, p. 97).
Cette conception classique de la terminologie est d’ailleurs appliquée dans les tentatives d’introduction des techniques du génie cognitif à l’analyse terminologique des concepts. Ce fut, par exemple, le cas du projet pilote lancé en 1989 à la Direction de la terminologie et des services linguistiques (Meyer, Paradis : 1991). Les résultats obtenus dans les domaines techniques manipulant des concept-objets physiques sont très encourageants. Il reste à évaluer les mêmes techniques lors de l’analyse des concepts-processus abstraits ou évolutifs.

Bibliographie

Apresjan, J.D. "Regular Polysemy", Linquistics, 142, Mouton, 1973.

Atkins, S. "Lexical rules: polysemy", Février 1990 (manuscrit).

Beckwith, R. et G. Miller. "Implementing a Lexical Network", International Journal of Lexicographv, 3-4, 1990, pp. 302-312.

Benson, M. et al. The BBI Combinatory Dictionary of English. A Guide to Word Combinations, John Benjamins, 1986.

Boden, M. The Creative Mind, Harper Collins Publishers, 1990.

Brugman, C. "What is the Invariance Hypothesis?", Cognitive Linguistics, vol. 1-2, 1990, pp. 257-266.

Budin, G. "Terminological Analysis of LSP Phraseology", Terminology Science and Research, vol. 1, 1990, pp. 64-69.

Cohen, B. Lexique des cooccurrents, Bourse – Conjoncture, Linguatech, 1986.

Czap, H. et C. Galinski. (eds) Terminoloqy and Knowledge Engineering, Frankfurt, Indeks Ferlag, 1987.

Draskau, J.K. "Some Reflections on Equivalence/Äquivalenz as a Term and a Concept in the Theory of Translation", Meta, 36-1, 1991.

Ehegötz, E. "Versuch einer Typologie von Entsprechungen im zweisprachigen phraseologischen Wörterbuch", Z. Slaw., 35-4, 1990, pp. 499-504.

Fellbaum, Ch. "English Verbs as a Semantic Net", International Journal of Lexicography, 3-4, 1990, pp. 278-301.

Fillmore, Ch. "Remarks on Contrastive Pragmatics", Contrastive Linguistics. Prospects and Problems, J. Fisiak (éd), Mouton, 1984

Galinski, Ch. "Terminology and Phraseology", Terminology Science and Research, vol. 1, 1990, pp. 70-86.

Goffin, R. « Structures lexicales, terminologies techniques et glossaires contextuels multilingues », Meta 18-1/2, 1972, pp. 237-253.

Gouadec, D. « Traduction, rédaction, (franc)isation », Traduction Terminologie Rédaction, UQTR – Université Concordia, Montréal, 2-1, 1989, pp. 51-58.

Gross, D. et K.J. Miller. "Adjectives in WordNet", International Journal of Lexicography, 3-4, 1990, pp. 265-277.

Heid, U. et G. Freibott. « Collocations dans une base de données terminologiques et lexicales », Meta, 36-1, 1991, pp. 71-91.

Herting, B. « Transformations lexico-pragmatiques dans la traduction : leur nécessité, justification, leurs classes et effets pour le texte traduit », Babel, 36-3, 1990, pp. 129-142.

Hohnhold, I. et T. Schneider. « Terminological Records and Lexicon Entries. A Contrastive Analysis », Meta, 36-1, 1991, pp. 161-173.

Juhel, D. et L. Meney. « Les difficultés traductionnelles du Guide de l’utilisateur IBM-PC : quelques voies de solutions », Le Langage et l’Homme, 25-4, 1990, pp. 278-283.

Kjaer, A.L. "Phraseology Research. State of the Art", Terminology, Science and Research, IITF, 1-1/2. 1990, pp. 3-20.

Kukulska-Hulme, A. « Un dictionnaire actions-acteurs pour l’informatique », Terminogramme, n^o 55, 1990, pp. 21-24.

Lainé, C. Vocabulaire collocationnel de la CFAO, RINT, Secrétariat d’État du Canada, 1991 – (en cours).

Lehrer, A. "Polysemy, Conventionality, and the Structure of the Lexicon", Cognitive Linguistics, vol. 1-2, 1990, pp. 207-246.

Mermin, D. Boojums All The Way Through. Communicating Science in a Prosaic Age, Cambridge University Press, Cambridge, 1990.

Meyer, I. et Paradis, L. "Applying Knowledge-Engineering Technology to Terminology: A Pilot Project", Terminology Update, 24-2, 1991, pp. 3-8.

Miller, G. "Nouns in WordNet : A Lexical Inheritance System", International Journal of Lexicography, 3-4,1990, pp. 245-265.

Molino, J. « Métaphores, modèles et analogies dans les sciences », Langages, vol. 54, 1979, pp. 83-102.

Mrosowski, B. et P. Coulon. « Quelques aspects de la phraséologie comparée », Fremdsprachen, 22-2, 1978, pp. 125-128.

Newmark, P. "Paragraphs on Translation", The Linguist, 30-1, 1991, pp. 28-32.

Norrick, N. Semiotic Principles in Semantic Theory, Amsterdam, John Benjamins, 1981.

Pavel, S. Intelligence logicielle. Dictionnaire français-anglais, RINT, Secrétariat d’État du Canada, Ottawa, 1989.

Pavel, S. & Boileau, M. Vocabulaire de l’imagerie fractale, Secrétariat d’État du Canada/RINT, 1991 – (en cours).

Picht, H. "Terms and their LSP Environment-LSP Phraseology", Meta, 32-2, 1987, pp. 149-155.

Picht, H. "A Study of LSP Phraseological Elements in Spanish Technical Texts", Terminology Science and Research, IITF, 1-1/2, 1990.

Picht, H. "LSP Phraseology from the Terminological Point of View", Terminology Science and Research, IITF, 1-1/2, 1990, pp. 33-48.

Rondina, M. Lexique bilingue de la violence familiale. Secrétariat d’État du Canada, 1991 – (en cours).

Sowa, J.F. Conceptual Structures, Reading MA., Addison-Wesley, 1984.

Turner, M. "Aspects of Invariance Hypothesis", Cognitive Linguistics, vol. 1-2, 1990, pp. 247-255.

Wijnands, P. « Les systèmes experts un moyen d’enrichissement pour la discipline terminologique », in Translation and Meaning (Part 1), Thelen, M. et B. Lewandowska-Tomaszczyk (éds), Euroterm Maastricht, 1990.

Williams, M. "The Assessment of Professional Translation Quality: Creating Credibility out of Chaos", Traduction Terminologie Rédaction (TTR), Études sur le texte et ses transformations, 2-2, 1989, pp. 13-33.