ARCHIVED 4.7.2. Textos eletrônicos e reconhecimento óptico de caracteres (OCR)
Archived Content
Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject to the Government of Canada Web Standards and has not been altered or updated since it was archived. Please contact us to request a format other than those available.
Consult the Pavel in ...
Español Português Italiano Nederlands العربية
Os organismos governamentais, os institutos de pesquisa, as universidades e as empresas do setor privado difundem por meio de seus sites um número cada vez mais elevado de documentos eletrônicos, autorizando os usuários a baixarem os arquivos. Você pode ter acesso à documentação de associações profissionais, à imprensa escrita e às redes de televisão gratuitamente ou mediante pagamento. Essas fontes documentais são, atualmente, as mais utilizadas em terminologia para fins de extração de termos. Basta simplesmente localizá-las utilizando guias de busca e de navegação na Internet, indexá-las e extraí-las por meio de ferramentas como Isys Desktop 6 ou AltaVista Discovery. É possível, no entanto, que alguns documentos estejam disponíveis somente impressos em papel.
Nesse caso, você passa o texto selecionado em um escâner, a fim de obter uma versão eletrônica do documento. Após a digitalização do documento, você pode utilizar um programa de extração de termos com auxílio do computador ou um programa de extração automática de termos, como o Nomino, o MultiTrans ou o EdiTerm.
Dada a capacidade, ainda limitada, do OCR, não se recomenda utilizar esta opção para os documentos muito volumosos ou que têm leiaute complexo (gráficos, diagramas, tabelas, textos em várias línguas, etc.).
- Date modified: