ARCHIVED 4.7.2. Electronische teksten en OCR

 

Archived Content

Information identified as archived is provided for reference, research or recordkeeping purposes. It is not subject to the Government of Canada Web Standards and has not been altered or updated since it was archived. Please contact us to request a format other than those available.

Consult the Pavel in ...

Español Português Italiano Nederlands العربية

Previous page Next page

Overheidsinstellingen, onderzoeksinstellingen, universiteiten en organisaties uit de private sector verspreiden steeds meer electronische documenten via hun websites, met de toelating ze te downloaden. U kan ook documentatie vinden op de sites van beroepsverenigingen, de pers en televisiezenders, maar deze is niet altijd gratis. Deze documentatiebronnen worden momenteel het meest gebruikt voor termextractie in terminologiewerk. U moet ze alleen vinden met de hulp van zoek- en navigatiegidsen op het Internet, ze indexeren en ophalen met tools zoals Isys Desktop 6 of AltaVista Discovery. Bepaalde documentatie zal alleen in hardcopy beschikbaar zijn.

Als er alleen een hardcopy van het document beschikbaar is, kan u de tekst inscannen om zo een electronische versie te verkrijgen. Zodra u een door de computer leesbare tekst heeft, kan u gebruik maken van computerondersteunde of automatische software voor termextractie, zoals Nomino, MultiTrans of EdiTerm.

Gezien de huidige stand van zaken in OCR (optische karakterherkenning), is dit geen geschikte optie voor grote documenten of documenten met ingewikkelde layouts (grafische elementen, diagrammen, tabellen, verschillende talen, enz.).