ARCHIVED 2.3.3. L’analyse de corpus textuels

 

Archived Content

Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject to the Government of Canada Web Standards and has not been altered or updated since it was archived. Please contact us to request a format other than those available.

Consult the Pavel in ...

Español Português Italiano Nederlands العربية

Previous page Next page

Les particularités de la recherche qu’on vous demande d’entreprendre et des produits terminologiques que vous êtes censé livrer aux utilisateurs déterminent la portée de toute analyse de contenus spécialisés. Si vous travaillez pour le service de communication d’une entreprise, les employés et les clients de cette entreprise vous poseront des questions ponctuelles sur des problèmes terminologiques spécifiques : Quelle est la définition correcte d’un terme rencontré? Est-ce que l’usage qu’on fait d’un terme dans un texte particulier est approprié ou erroné? Quel est l’équivalent correct d’un terme de départ dans une langue spécialisée cible? etc. Dans ce cas, votre analyse de corpus textuels pour répondre à ces types de questions sera brève, limitée et ira droit au but. D’autre part, vos collègues et vos clients pourraient vous demander d’entreprendre des recherches détaillées et complètes sur la terminologie d’un domaine ou d’un sous-domaine, et de leur livrer cette terminologie dans une publication de type vocabulaire monolingue, bilingue ou multilingue. Dans ce cas, la portée de l’analyse que vous entreprendrez dans un corpus cohérent thématiquement sera incomparablement plus vaste et prendra beaucoup plus de temps et de ressources.

La première chose à faire avant de se lancer dans une recherche thématique est d’établir un répertoire ou une bibliographie des sources écrites à dépouiller (le corpus textuel de votre analyse de contenus spécialisés). Il est préférable d’avoir votre répertoire électroniquement pour vous faciliter les ajouts ou les rejets, et de coder chacune des sources retenues afin de pouvoir les inscrire facilement après chacune des citations ou attestations d’usage que vous aimeriez consigner ultérieurement sur vos fiches terminologiques. Si vous utilisez ces codes lors de la saisie des fiches dans une base de données disponible pour consultation, vous devrez fournir aux utilisateurs un moyen simple de décodage des sources en codes sur vos fiches. Ce type de répertoire codé est souvent intégré dans les grandes banques de données terminologiques en tant que base de données documentaires.

Votre répertoire vous aidera à rassembler un corpus textuel très varié qui comprendra :

  • documents internes ou publiés dans le domaine étudié, à grande diffusion ou à diffusion restreinte
  • bases de données, dictionnaires, ouvrages terminologiques, diverses bibliographies
  • sites et portails Internet repérables à l’aide de moteurs de recherche ponctuelle (p. ex. WebCorp) ou thématique (p. ex. Vivísimo)
  • répertoires de publications et bibliographies obtenues par des documentalistes en ligne (si vous disposez d’un service documentaire, ils peuvent vous télécharger des textes trouvés sur Internet)
  • textes recommandés par vos personnes-ressources ou vos spécialistes du domaine en question (ces derniers pourraient vous aviser aussi sur la qualité de certaines publications spécialisées)
  • informations et articles repérés dans les journaux et périodiques spécialisés traitant des développements les plus récents dans la discipline en question
  • actes de colloques, conférences et symposiums
  • lois et règlements en vigueur dans la spécialité visée
  • glossaires, lexiques et vocabulaires internes
  • manuels, brochures et dépliants
  • textes promotionnels et publicitaires

Vous aurez à examiner et à évaluer toute la documentation répertoriée, à tenir compte des avis donnés par les spécialistes et les autres personnes-ressources, et ce, afin de sélectionner les textes les plus représentatifs du savoir véhiculé dans la spécialité à l’étude. En analysant ce contenu spécialisé, vous serez en mesure d’adopter le système de classement le mieux adapté pour le structurer, d’établir les arbres de domaines et les réseaux associatifs les plus appropriés pour le représenter, et d’en extraire les termes ou les unités terminologiques désignant les concepts propres du domaine.

Exercice

Lisez la question ci-après et énumérez les sources par ordre décroissant de leur importance.

Lesquelles des sources suivantes sont les plus aptes à contenir les meilleurs néologismes français dans le domaine relativement récent de l’apprentissage en ligne?

Liste des sources

  • Source A : Monographies (p. ex. Le e-learning, par Sandra Bellier, Rueil-Malmaison (France) : Éditions Liaisons, 2001, (collection Entreprise et carrière), 139 pages; Exploration d’Internet, recherches en éducation et rôles des professionnels de l’enseignement, ouvrage collectif sous la direction de Margot Kaszap et al, Sainte-Foy (Québec) : Presses de l’Université Laval; Paris : L’Harmattan, 2001 (collection Laboratoire de communautique appliquée), 268 pages).
  • Source B : Périodiques spécialisés (p. ex. Revue des sciences de l’éducation (Canada), vol. 27, no 2, 2001; Internet professionnel : les solutions internet et intranet pour l’entreprise, no 58, 2001).
  • source C : Revues de vulgarisation pédagogique (p. ex. La Vie : hebdomadaire chrétien d’actualité, no 2945, février 2002, Science et vie, no 193, mai 2001).
  • Source D : Sites Internet sur l’apprentissage en ligne (p. ex. Institut européen du e-learning (2001); Centre AlphaPlus : rapports de recherche sur l’apprentissage en ligne; L’éducation en ligne : Les acteurs (France)).
  • Source E : Encyclopédies et dictionnaires (p. ex. l’encyclopédie Universalis, 1990; Encyclopédie Larousse, 1985, Dictionnaire actuel de l’éducation, par R. Legendre, Montréal : Guérin, 1993).

   Answers