OCR-Software ist ein Programm, das aus gescannten Bildern nachbearbeitbaren Text macht (OCR = engl. Optical Character Regognition oder optische Zeichenerkennung), vorausgesetzt, man scannt Textseiten.
Oftmals liegt sie neu gekauften Scannern bereits auf einem mitgelieferten Datenträger bei, kann gelegentlich aber auch auf der Treiber-CD enthalten sein. Prüfe einfach den Inhalt der zu Deinem Gerät gehörigen CD(s).
Ein anderer namhafter japanischer Hersteller von Kameras, Scannern, Druckern usw. beispielsweise liefert zu vielen seiner Scannermodelle die OCR-Software gleich mit, und zwar dergestalt, dass man in PDF scannen kann, wobei aber nicht einfach die gescannte Seite als Digitalbild in einen PDF-Container gepackt wird (wie das sonst vielfach üblich ist), sondern der gescannte Text ohne Weiteres im PDF markier- und in die Zwischenablage kopierbar ist. Und das fehlerfrei!
OCR-Software liest eine gescannte Textseite zunächst als digiale Bilddatei ein (kann man sich als eine Fläche mit vielen Kacheln vorstellen). Anhand der Farbunterschiede (Papier weiß, Buchstaben schwarz) versucht sie in einem weiteren Arbeitsgang, die Buchstaben zu erkennen und produziert daraus eine Textdatei, die in eine Textverarbeitung geladen werden kann. Je nach Qualität des Ausgangsmaterials ist die Erkennungsrate dabei besser oder schlechter mit der Folge, dass der User mehr oder weniger Nacharbeiten zu leisten hat. Bei der Leistungsfähigkeit heutiger Scanner jedoch kaum mehr ein Problem.
ohmsl's Vorschlag Richtung abyy FineReader beispielsweise kann ich unterstützen. Lag meinem Scanner in einer abgespeckten Version bei und arbeitet absolut tadellos.