Textscannen und Texterkennung (OCR)
Stand: November 2007
Ansprechpartner: Heino Klaus, Gerd Heßler
Geräteausstattung
Zum Scannen von Texten stehen im Grafiklabor folgende Geräte zur Verfügung:
- ein DIN A3 Microtek Flachbett-Scanner ScanMaker 1000XL für Aufsicht- und Durchsichtvorlagen (Filme, Folien) an der Workstation rzglab12,
- ein Canon Dokumentenscanner DR-4010C (A4- Einzugsscanner) an der Workstation rzglab12,
Scanner-Software und Texterkennung
Scannen und Texterkennung (Optical Character Recognition) sind getrennte Vorgänge, die jedoch mit Hilfe der OCR-Software in einem Arbeitsgang durchgeführt werden können.
Alternativ kann man den Bearbeitungsvorgang auch trennen. Die gescannten Texte werden zunächst als Bitmap-Dateien gespeichert und in einem zweiten Arbeitsgang wahlweise in ASCII-Texte oder in Formate unterschiedlicher Textverarbeitungsprogramme umgewandelt.
Die in Vorlagen enthaltenen Grafiken können als Rasterfiles gesondert abgespeichert werden.
Der Aufruf erfolgt
- auf der Workstation rzglab12 über das Startmenü:
Start/Programme/ABBYY FineReader
Generell wird zur Texterkennung die Nutzung der leistungsfähigeren FineReader Software empfohlen.
Eine Vielzahl von Optionen und Einstellungen erlaubt die Anpassung des Verarbeitungsprozesses an unterschiedliche Layouts und Vorlagequalitäten. Die Zeichenerkennung ist trainierbar, und somit kann nach kurzer Zeit ein sehr hoher Anteil an richtig erkannten Zeichen erreicht werden.
Zusätzlich Informationen können dem Handbuch oder der Online-Hilfe entnommen werden.
- Der OCR-Arbeitsplatz befindet sich im Erdgeschoß der Gebäudes Herrmann-Rodewald-Straße 3, Raum 204 (rzglab12).
- Bei Erstbenutzung ist eine Einweisung durch die Operateure (Tel. 2765) erforderlich.


