ARCHIVÉE 4.7.2. Los textos electrónicos y el reconocimiento óptico de caracteres (ROC)

 

Contenu archivé

L’information dite archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et n’a pas été modifiée ni mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, Contactez-nous.

Consulter le Pavel en ...

Español Português Italiano Nederlands العربية

Page précédente Page suivante

Los organismos gubernamentales, los institutos de investigación, las universidades y las organizaciones del sector privado difunden a través de sus páginas web un número cada vez mayor de documentos electrónicos, autorizando a los usuarios a descargarlos en sus propias computadoras. Los sitios de las asociaciones profesionales, la prensa escrita y la televisión ponen su documentación a disposición de los interesados, ya sea de forma gratuita o mediante el pago de un importe. Esas fuentes documentales son, por lo general, las más utilizadas en terminología para fines de extracción de términos. Se trata simplemente de localizarlas utilizando guías de búsqueda o de navegación en Internet, indexarlas y recuperarlas mediante herramientas como Isys Desktop 6 o Alta Vista Discovery.

Lamentablemente, es posible que cierta documentación sólo esté disponible en papel. En estos casos, podrá escanear el texto para obtener una versión electrónica, lo que le permitirá utilizar un programa informático de extracción de términos asistido por computadora o un programa de extracción automática como Nomino, MultiTrans o EdiTerm.

Dada la capacidad, todavía limitada, de los lectores ópticos de caracteres, no se recomienda utilizar esta tecnología para los documentos muy voluminosos o con un diseño complicado (gráficos, diagramas, tablas, varias lenguas, etc.).