ARCHIVÉE 4.7.2. Textos eletrônicos e reconhecimento óptico de caracteres (OCR)

 

Contenu archivé

L’information dite archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et n’a pas été modifiée ni mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, Contactez-nous.

Consulter le Pavel en ...

Español Português Italiano Nederlands العربية

Page précédente Page suivante

Os organismos governamentais, os institutos de pesquisa, as universidades e as empresas do setor privado difundem por meio de seus sites um número cada vez mais elevado de documentos eletrônicos, autorizando os usuários a baixarem os arquivos. Você pode ter acesso à documentação de associações profissionais, à imprensa escrita e às redes de televisão gratuitamente ou mediante pagamento. Essas fontes documentais são, atualmente, as mais utilizadas em terminologia para fins de extração de termos. Basta simplesmente localizá-las utilizando guias de busca e de navegação na Internet, indexá-las e extraí-las por meio de ferramentas como Isys Desktop 6 ou AltaVista Discovery. É possível, no entanto, que alguns documentos estejam disponíveis somente impressos em papel.

Nesse caso, você passa o texto selecionado em um escâner, a fim de obter uma versão eletrônica do documento. Após a digitalização do documento, você pode utilizar um programa de extração de termos com auxílio do computador ou um programa de extração automática de termos, como o Nomino, o MultiTrans ou o EdiTerm.

Dada a capacidade, ainda limitada, do OCR, não se recomenda utilizar esta opção para os documentos muito volumosos ou que têm leiaute complexo (gráficos, diagramas, tabelas, textos em várias línguas, etc.).