OCR

Das Akronym OCR steht für die „Optical Character Recognition“, zu Deutsch: „Optische Zeichen Erkennung“. Die OCR wandelt Zeichen (Pixelbilder) in einem Dokument um und stellt anhand des gelernten Alphabets bzw. Semiotik (Bspw. Latein, Russisch, Kanji, Hiragana …) fest, um welches Zeichen es sich handelt.

Der so ausgelesene Text wird als zusätzliche sog. „Volltextinformation“ zu dem Dokument abgespeichert, wodurch das gesamte Dokument volltext-durchsuchbar wird.

Beachten Sie: Nicht jede OCR funktioniert gleich gut. Es kommt immer darauf an, wie gut eine bestehende OCR angelernt ist bzw. werden kann.