ARCHIVÉE Siglaison et créativité lexicale en intelligence artificielle
Contenu archivé
L’information dite archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et n’a pas été modifiée ni mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, Contactez-nous.
Consulter le Pavel en ...
Lorsque Louise de Vilmorin écrit dans son Alphabet des aveux :
ABI ABI
G AC CD ME OBE
E WQ REV FUI
pour dire :
« Abbaye, abbaye,J’ai assez cédé, aimé, obéi
Et double vécu et rêvé et fui »
(Debyser 1986 : 85)
Le murmure de l’aveu est suggéré par un procédé d’encryptage textuel qui, épellation et majuscules à part, se rapproche de l’écriture arabe plus que de la siglaison. Car l’écriture arabe habituelle ne retient des mots que les contours syllabiques, tandis que dans les langues romanes, slaves et germaniques, la siglaison consiste à réduire des mots et des syntagmes aux éléments initiaux de leurs composants. C’est un procédé de création lexicale ancien, économique et productif (Calvet 1980) qui se retrouve tant en langue courante (RSVP) qu’en langue de spécialité (maser), et autant en langue écrite qu’en langue parlée.
Dans le domaine de l’informatique, par exemple, le nombre et la fréquence d’emploi des sigles ont rendu nécessaire l’ajout d’une section <sigles et appellations> à la fin des monographies et des dictionnaires récents. De nos jours, les dictionnaires de sigles et les bases de données sur les appellations sont devenus tout aussi indispensables au terminologue comparatiste et au traducteur spécialisé que les encyclopédies et les vocabulaires technoscientifiques.
Dans cette prolifération du sigle, certains décèlent des tendances à contenir, sinon à combattre. La pratique de la siglaison dans des spécialités d’avant-garde comme l’informatique et l’intelligence artificielle nous semble présenter toutefois un intérêt linguistique et terminologique suffisant pour qu’on en parle dans le contexte de la créativité lexicale en langues spécialisées.
Caractéristiques générales du sigle
Rappelons que le français distingue le sigle épelé (ED – expert du domaine) de l’acronyme – sigle prononcé en un mot (CAO – conception assistée par ordinateur) tandis que l’anglais désigne les deux types de sigles « letter-reciting » et « letter-sounding » par le mot « acronym » (Kreidler 1979). La siglaison peut être intégrale, c’est-à-dire retenir les lettres ou syllabes initiales de tous les mots pleins d’un syntagme (SIAD – « système interactif d’aide à la décision »), ou partielle (poset – « partially ordered set »). Les mots vides n’en sont pas toujours exclus : DDL – « degré de liberté » et DL coexistent en synonymes; AKO link signifie « A-Kind-Of link ».
À l’intérieur de la phrase, le sigle peut se substituer aux unités lexicales de toutes les catégories grammaticales. En langue de spécialité, il reste souvent invariable et forme relativement peu de dérivés autres qu’adjectivaux. Ses dérivés nominaux et verbaux prolifèrent surtout en langue courante (George 1977) : CEGEP – cégépien; STQ – estécois; ENA – énarque; HLM – HLMiser, etc.
Sur le plan lexical, les cas d’homonymie sont rares : en français, PAO renvoie à « programmation assistée par ordinateur » et à « publication assistée par ordinateur »; RAM remplace « robot autonome multitâches » en robotique et « registre d’adresse mémoire » en informatique où l’on connaît aussi l’emprunt RAM (random access memory). L’emploi en contextes situationnels différents conjure la confusion. Le sigle est le synonyme paronymique de son « syntagme-source » (Kocoureck 1982 : 141). Certains sigles (radar, laser) sont mieux connus que leurs syntagmes explicatifs et passent en langue courante en dépit de leur caractère transitoire et plutôt cryptique : le nom de marque Fiat provient d’un sigle signifiant « fabrique italienne d’automobiles à Turin ».
Sur le plan sémantique, le sigle s’inscrit dans la catégorie des appellations monoréférentielles, entre celle des noms propres et celle des descriptions définies : « noun-phrases that identify some specific individual or class of individuals not only by naming it – as proper names do – but also by providing the hearer/reader with a description of it sufficiently detailed in the particular context of utterance, to distinguish it from all other individuals in the universe of discourse » (Lyons 1977 vol. 1 : 179). Ainsi que Searle (1969 : 81) le faisait remarquer, cette catégorie « shades off into definite descriptions at one end and proper names at the other ».
Quelques caractéristiques de la siglaison IA
En effet, tout comme les noms propres, certains sigles IA ne se traduisent pas. D’autres sont identiques en plusieurs langues : MAIA est formé sur « machine pour applications de l’intelligence artificielle » en français et « machine for artificiel intelligence applications » en anglais. Mentionnons dans la première catégorie RTN (Recursive Transition Network) et INKA (Interactive Knowledge Acquisition) System, repris en français dans des constructions appositives : réseau RTN, réseau de transition récursif RTN, et système INKA.
Le sigle participe ainsi à la création syntagmatique : langage C, grammaire Pop-11, algorithme PMPM (Parallel Marker Propagation Machine) et système intelligent CAO-VLSI où CAO est traduit, mais VLSI ne l’est pas.
Les noms des langages IA les plus répandus – LISP (LIST Processor) créé par le mathématicien John McCarthy, et PROLOG (PROgrammation LOGique) inventé en France par Alain Colmerauer – sont des sigles assimilés à plus d’un titre au nom propre. On remarque de prime abord l’intégration phonique : prononciation en un mot. Quant à la graphie en majuscules séparées par des points, elle a déjà cédé la place à celle du nom propre (Lisp, Prolog) selon des tendances observées il y a quinze ans dans l’usage administratif (Unesco, Onu) et qui seraient des conséquences directes du traitement informatique de texte (D. Gehenot 1975 : 283). Les dialectes LISP subissent à leur tour des transformations similaires : MACLISP, FRANZLISP et LE-LISP acquièrent la graphie MacLisp, FranzLisp et Le-Lisp par analogie avec des éléments anthroponymiques tels la particule Mac, le prénom « Franz » du compositeur Liszt et l’article défini « le ». À noter la précaution architextuelle qui préserve les distinctions entre le nom de marque et le nom propre : graphie en un seul mot et insertion du trait d’union entre l’article et le nom. D’autres sigles forment des composés (microProlog, Turbo-Basic, Turbo-C, Turbo-Prolog, CAO-VLSI) et même des mots valises : CAO-PAO devient CPAO ou Cpao (conception et production assistées par ordinateur), et POPLOG est une variante Prolog du langage POP, lui-même créé par la troncation du nom de son auteur R. Popplestone.
Enfin, LISP et PROLOG sont assimilés au nom propre servant de base de dérivation. Le paradigme d’adjectivation NP + (i/e)en qui a déjà donné « grammaire chomskienne », « algèbre booléenne », etc., transforme les syntagmes « syntaxes PROLOG » et « dialectes LISP » en « syntaxes prologiennes » et « dialectes lispiens » où, en plus de la dérivation par suffixation entraînant l’accord en nombre et en genre, l’on constate la disparition de la majuscule et la chute du sigle dans le domaine public du nom commun, tout comme radar, laser et fiat : les adjectifs « lispien » et « prologien » sont nominalisés par dérivation impropre avec le sens « concepteur de programme en langage LISP ou PROLOG ».
Motivation du sigle IA
Plus le syntagme descriptif auquel la siglaison se substitue est long, plus la siglaison permet de gagner en concision et en maniabilité ce que l’on a perdu en transparence motivationnelle. Or la motivation – capacité de l’unité lexicale à suggérer les éléments du contenu par ses éléments formels – est un aspect essentiel des terminologies technoscientifiques. Elle découle de l’intellectualisation des langues de spécialité (Kocoureck 1982 : 151) et gouverne la dénomination des concepts nouveaux. Les éléments constitutifs d’un terme bien formé renvoient aux traits intrinsèques (forme, matériau, couleur, dimension) ou tout au moins extrinsèques (destination, provenance) de l’objet désigné. Toute typologie des motivations reflète ainsi en miroir une typologie de la formation lexicale (phonique, graphique, morphologique, syntagmatique et sémantique). Rien d’étonnant dès lors à ce qu’une communauté scientifique dédiée précisément à l’étude de l’intelligence, du langage et du savoir humains s’ingénie à combler les lacunes motivationnelles d’un élément terminologique omniprésent dans la communication spécialisée.
La créativité lexicale de la siglaison nous semble surgir, en l’occurrence, d’une espèce de fusion néologique de la forme et du sens : des procédés terminogènes figuratifs effectuent, sur le plan du contenu sémantique, des opérations parallèles à celle de la siglaison sur le plan formel.
C’est ainsi par métonymie (rapport de contiguïté) que la Communauté Européenne adoptait récemment le sigle BRAIN pour un programme de recherches neuroinformatiques sur le fonctionnement du cerveau humain et la création d’ordinateurs cognitifs pour la résolution de problèmes orientée-tâches (« Basic Research in Adaptive Intelligence and Neurocomputing », Europe, janvier 1988 : 47). C’est aussi par métonymie que R. Schank (1984 : 160) choisissait le sigle CYRUS pour un de ses programmes IA : « CYRUS stands for Computerized Yale Reasoning and Understanding System. It compiled a professional and personal history of Cyrus Vance. We knew the name had to be CYRUS – it was just a question of figuring out what CYRUS could be an acronym for ». Ici le sigle n’est plus formé à partir d’un syntagme explicatif mais inversement, c’est le syntagme qui se construit sur un sigle prédestiné. Il y a quelques années, ce procédé était spécifique du discours politique et publicitaire (F. Rodriguez Gonzales 1983 : 209). Il est possible qu’il se soit introduit en IA par le biais des produits, commercialisés ou non, tels les langages de programmation et les systèmes experts, mais il est certain que ce procédé dénominationnel est devenu très productif.
Les exemples abondent en français aussi : SAGESSE, nom-sigle d’un didacticiel intelligent créé en Belgique, signifie « Système Adaptatif et Génératif d’Enseignement de la Statistique en Sciences de l’Éducation ». Le projet LOUPE (Logiciels-Outils pour l’Enseignement), lancé récemment à Montréal, vise la création d’environnements d’apprentissage intelligents. La compagnie canadienne Logiciels Machina Sapiens développe un système d’enseignement du français écrit dont le nom SCARABEE est le sigle d’un syntagme complexe construit par rime et assonance : « Système de Conception Assistée de Récits d’Aventure dans le But d’Enseigner l’Écriture ». Et l’université française de Clermont II trouve au Cid de Corneille une application pédagogique aux mathématiques en le transformant en sigle CID « Création Interactive de Didacticiels ».
Le terme « intelligentsIA » par lequel la communauté IA francophone se plaît à se désigner constitue un autre exemple intéressant de fusion néologique. Graphiquement, le sigle IA se superpose à la terminaison homonyme d’un nom emprunté au russe et désignant les intellectuels d’un pays quelconque. Phoniquement, la nouvelle création se distingue par une prononciation hybride, mi-mot (intelligents) mi-sigle épelé (IA). Ces particularités formelles suggèrent l’appartenance des intellectuels ayant l’intellect comme objet d’étude, au groupe social qui se sert de l’intellect comme moyen de production principal. Les valeurs connotative, dénotative et mnémonique résultant de la fusion sigle / synecdoque donnent à cette création lexicale un avantage net sur le syntagme « communauté IA ».
En faisant appel à l’héritage culturel commun sans céder aux pressions de nivellement linguistique, le créateur du sigle facilite autant la compréhension que la mémorisation et l’utilisation internationale de sa création. Le langage informatique PASCAL inventé par Nicklaus Worth nous semble illustrer en précurseur cette tendance dénominationnelle de la terminologie IA.
Dans certains cas, la motivation symbolique provient d’une astuce traductionnelle. En 1984, un document officiel de la CEE annonçait : « Le 28 février dernier, la Communauté européenne a formellement approuvé le programme ESPRIT – Programme européen de recherche et développement dans le domaine des technologies de l’information » (CEE-38F-1984). En y regardant de près, on constate que les initiales du syntagme descriptif ne correspondent pas à l’acronyme ESPRIT, pourtant bien français. Le texte anglais nous éclaire : « The European Strategic Programme for Research and Development in Information Technology – ESPRIT – was formally approved by the European Community... » (CCE-38E-1984).
Un autre procédé figuratif – la personnification – peut fournir la motivation nécessaire. Les sigles de nombreux programmes et activités IA renvoient à des noms propres ou à des diminutifs courants : BORIS, CATIA, NOAH, MARGIE, PAM, SAM, SOPHIE. En français, les graphies nom propre abondent : Alice, Ada, Esope, Tina, etc. Mais Ada, Margie, Maia, Catia, etc. s’accordent au masculin d’un antécédent fantôme : programme, langage, système.
À la limite, on se contente du nom évocateur sans plus recourir au sigle, ni au syntagme descriptif. Dans les années soixante, Joseph Weizenbaum baptisait du nom ELIZA toute une famille de programmes de dialogue homme-machine en langage naturel. Il expliquait le choix de cette métaphore anthropomorphique comme suit : « The name was chosen to emphasize that its language abilities may be continually improved by a ‘teacher’. Like the Eliza of Pygmalion fame, it can be made to appear even more civilized... » (Suchman 1987 : 22). Un débogueur (metteur au point) automatique de programmes Pascal a été appelé PROUST parce que, selon ses auteurs, il est à la recherche d’erreurs perdues « remembrance of blunders past ». Un autre programme, qui applique PROUST à la statistique, s’appelle GIDE. On retiendra ailleurs l’allusion synecdotique généralisante des appellations EXPERT, PROSPECTOR ou INTERNIST, ainsi que le rapport d’inclusion particularisant entre les lois de Francis Bacon et celles que le système expert BACON s’emploie à redécouvrir, ou l’analogie entre l’exploit du constructeur légendaire du labyrinthe de Crète et le dédale d’instructions mises en oeuvre par le système DEDALUS pour la synthèse de programmes IA.
Sous l’effet de l’interaction entre appellation, nom propre et description définie, l’immotivation du sigle se dissout littéralement dans la synecdoque – le procédé figuratif qui lui ressemble le plus, dans l’anthropomorphisme métaphorique du nom propre ou bien dans la transparence descriptive de la métonymie.
Niveau de langue et siglaison
La distinction écrit/parlé concerne les types de réalisation du langage plus que les niveaux de langue : on peut écrire en argot et discourir savamment tout comme on peut écrire une langue soignée et en parler une variante relâchée. Le même locuteur peut passer d’un type à l’autre selon les circonstances de la communication.
La distinction langue courante/langue de spécialité ne joue pas non plus un rôle décisif dans la délimitation des niveaux de langue : qu’elle soit vue comme une extension de la langue courante ou comme une réduction de celle-ci, la langue de spécialité polarise ses niveaux en standard/non standard ou conventionnel/ non conventionnel tout comme la langue courante. La spécificité d’un niveau de langue nous semble ressortir des fonctions de l’acte de parole, de l’usage des moyens choisis pour les remplir (créativité lexicale comprise) et, accessoirement, du degré d’écart par rapport à un système de formes.
Ainsi, la fonction principale de la langue de spécialité standard est dénotative (transmission du savoir), ce qui n’empêche pas un certain penchant pour la connotation méliorative. En siglaison IA, la prépondérance du sigle nominal et l’anthropomorphisme des appellations contribuent à rehausser la valeur connotative méliorative des sigles. L’argot professionnel, dont la fonction de communication est autrement expressive, recherche par contre l’imprévisibilité ludique à effet mnémotechnique. Par écrit, la siglaison d’expressions usuelles et de phrases elliptiques du genre RAS (rien à signaler), NPPS (ne passera pas la semaine), ou KISS (Keep it simple, stupid) apparaît souvent dans la messagerie électronique multipoint reliant divers laboratoires de recherche aux États-Unis (G.L. Steele 1983) : BCNU (Be seeing you!), RUTHERE? (Are you there?), CUL (See you later!), GA (Go ahead!), etc. Dans la conversation, les sigles d’instructions LISP deviennent des verbes et acquièrent des sens figurés, d’une irrévérence tout argotique. Ainsi TERPRI (terminate a print line) devient « to terpri » – « laisser tomber et passer au suivant »; JRST (jump and restore flags), prononcé « to jurst », prend le sens de « passer du coq à l’âne à un rythme effréné »; l’instruction d’insertion d’octets, DPB (deposit byte), devient une invitation à s’asseoir dans un espace exigu « dipib yourself there »; le sigle épelé GC (garbage collection) désignant une technique de recyclage de la mémoire est lui aussi verbalisé avec le sens de « nettoyer à fond », ex. « l’Il GC my desk now ». Notons par ailleurs l’origine argotique de « garbage collector » synonyme du terme standard « reclaimer » qu’il remplace de plus en plus sur son propre terrain. La siglaison argotique IA partage ici la préférence de la langue courante pour les dérivés verbaux et celle de tout argot pour l’hyperbole.
L’argotier s’inquiète peu des règles de siglaison et se plaît à bouleverser les relations conceptuelles établies au niveau de la langue standard : le syntagme « nonexistent memory » – réponse de l’ordinateur lorsqu’on essaie d’accéder à sa mémoire par une adresse non enregistrée – désigne une des tentatives d’accès englobées dans le générique « illegal memory reference ». L’argot crée respectivement le sigle NXM où X n’est qu’une initiale phonique de « existent », et l’apocope multiple « ill mem ref », peu orthodoxe puisqu’elle est écrite en trois mots au lieu d’un seul, et prononcée en deux. Qui plus est, ces deux créations argotiques sont employées à bon escient comme synonymes de « blanc », « trou de mémoire (humaine) ». Ironie de l’emploi figuratif multiple : le mot « mémoire », qui suggère métaphoriquement la capacité quasi humaine de l’ordinateur à enregistrer les données, était passé de la langue courante à la terminologie informatique à cause de sa connotation méliorative. L’argot IA nous le renvoie, diminué et méconnaissable, sous les lambeaux adjectivaux de « nonexistent » et « illegal », pour signaler les défaillances de la mémoire humaine.
À en juger d’après la richesse des argots français consignés par A. Rey et J. Cellard dans le Dictionnaire du français non conventionnel, l’argot IA devrait se démarquer du discours conventionnel par la spécificité de ses créations autant que le « AI slang » s’écarte de l’anglais standard. Mais, en ce moment, il est difficile d’en avoir la certitude car l’étude comparative des procédés terminogènes du technolecte IA se heurte, pour ainsi dire, à un véritable barrage de NXM français.
Pour déconcertant qu’il soit, le fait a néanmoins ceci de positif qu’il confirme la nécessité de diversifier les enquêtes sociolinguistiques (J.-P. Goudaillier 1987 : 361) de façon à enregistrer, en plus de l’usage terminologique standard, celui des argots professionnels dans les technosciences de pointe. Les relevés d’usage serviront moins de modèles de créativité que de moyens pour mieux comprendre la dynamique néologique à tous les niveaux linguistiques d’une spécialité, telle que saisie sur le vif, dans les comportements et les attitudes des locuteurs francophones.
On dit que la langue de la jeunesse peut être plus représentative de l’avenir d’une langue que celle des parents ou grands-parents. De même, l’usage linguistique des technosciences naissantes pourrait s’avérer, dans l’avenir, représentatif des langues de spécialité.
Bibliographie
Anctil, H. 1980. « Le sigle et la langue des robots » in Carrefour des affaires sociales, vol. 2, no 4, p. 38-39.
Calvet, L.-Y. 1980. Les sigles, coll. « Que sais-je? », no 1811, Paris, PUF, 123 p.
CCE-38 F/CCE-38E 1984. « Projet de décision adoptant le programme ESPRIT », La Commission des Communautés européennes, Bruxelles/« Draft decision adopting ESPRIT », Commission of the European Communities, Brussels.
Cellard, J. et Rey, A. 1980. Dictionnaire du français non conventionnel, Paris, Hachette, 900 p.
Clas, A. 1980. « De la formation de mots nouveaux » in Meta, vol. 25, no 3, p. 345-347.
Debyser, A. 1986. « Sigles et logos : des initiales qui font des mots » in Le Français dans le monde, no 205, nov.-déc. 1986, p. 83-85.
Devereux, R. 1984. « Shortenings, Blends and Acronyms » in Word Ways, 1984, vol. 17, no 4, p. 210-215.
Falardeau, C. 1980. « Faut-il se resigler? » in Antennes, no 17, p. 54-55.
Gehenot, D. 1975. « Le sigle – aperçu linguistique » in Meta, vol. 20, no 4, p. 271-307.
Genette, G. 1970. « La rhétorique restreinte » in Communications, no 16. p. 158-172.
George, K.E.M. 1977. « La siglaison et les dérivés de sigles en français contemporain » in Le Français Moderne, vol. 15, no 1, p. 33-42.
Goudaillier, J.-P. 1987. « De la nécessité des enquêtes linguistiques pour le travail des commissions de terminologie » in Meta, vol. 32, no 3, p. 361-365.
Kocourek, R. 1982. La langue française de la technique et de la science, Paris, La Documentation Française, Wiesbaden : O. Brandstetter Verlag, 234 p.
Kreidler, Ch. W. 1979. « Creating New Words by Shortening », in Journal of English Linguistics, vol. 13, March, p. 24-36.
Kurokhtina, G.N. 1982. « Nekotorye zakonomernosti rasstanovki udareniya v russkikh initsial’nykh abbreviaturakh (Quelques modèles d’accentuation des sigles en russe) » in Vestnik Moskovskogo Universiteta, Filologiya, vol. 37, no 9-3, p. 41-50.
Lyons, Y : 1977. Semantics, 2 vols., London, Cambridge University Press.
Rodriguez Gonzales, F. 1983. « On the Coining of Acronyms by Homonymy », in Anglo-American Studies, vol. 3, no 2, p. 209-221.
Schank, R. and P.G. Childers 1984. The Cognitive Computer: On Language, Learning and Artificial Intelligence. Reading, Mass., Addison-Wesley Publ. Co., 268 p.
Searle, J.R. 1969. Speech Acts, London, Cambridge University Press.
Steele, G.L. 1983. The Hacker’s Dictionary: A Guide to the World of Computer Wizards, New York: Harper & Row, 139 p.
Suchman, L 1987. Plans and Situated Actions, London, Cambridge University Press.
Zugun, P. 1985. « Definitia compunerii » (Une définition de la composition) in Limba romana, vol. 34, no 3, p. 256-258.
« News of the EC – Science and Technology » in Europe. Magazine of the European Community, no 273, January-February 1988, Washington, DC.
- Date de modification :