(S) OCR-Software

  • #1
B

bergfranke

Bekanntes Mitglied
Themenersteller
Dabei seit
19.01.2002
Beiträge
2.313
Reaktionspunkte
0
Ort
Rhön/Thüringen
Wer kann hier mal eine Empfehlung für eine gute und preiswerte Software geben. Kann schon älter sein, dass man sie jetzt billiger bekommt. Soll vor allen die Möglichkeiten biete, Schriftarten voreinzustellen und Übernahme von Korrekturen (einzelne Buchstaben).
gruss clasaf
 
  • #2
Abbyy Fine Reader Pro

Nicht ganz billig, aber preiswert. :) ~ 150 €
 
  • #3
bei aktuellen scannenr ist meistens was auch schon brauchbares dabei.
und wozu willst du schriftarten voreinstellen? was weisst du da?
 
  • #4
Danke für die Antworten
150 Euro ist, gelinde gesagt, für mich unerschwinglich. Sage ich ohne Vorwurf an Zeus.
Was so allgemein bei Scannern dabei liegt (bei mir Mustek 1200 UB war nichts dabei), ist nicht das gelbe vom Ei.
Zu der Schriftvoreinstellung ist mir mal gesagt worden, dass dies die Erkennung verbessert.
Mir ging es hier eigentlich um Erfahrungen mit etwas älteren Programmen, die z.B. bei Pearl relativ billig zu bekommen sind.
gruss clasaf
 
  • #5
um welche ältere Programme geht es?
 
  • #7
omnipage wäre meine empfehlung. damit arbeite ich schon sehr lange. gibt es in einer SE-version als freeware.
beispielsweise hier:


wenn du selbst suchen möchtest, musst du nach omnipage se suchen.

einarbeiten musst du dich immer bei solch einer software.

bedenke: es gibt zwar viele module/plugins für unterschiedliche sprachen - das hat aber überhaupt nichts mit den zu erkennenden fonts zu tun.

dass heisst: auch wenn du eine seite einer bestimmten zeitschrift fast ohne korrektur erkennen lassen kannst, kann das erkennungsergebnis mit einer anderen zeitschrift dagegen viel zeit in anspruch nehmen, weil du diesen font fast komplett anlehren musst. möglichst für jeden font ein eigenes wörterbuch erstellen. das hält die wörterbücher klein und beschleunigt die erkennungsrate immens. das wirst du wohl gemeint haben, gibt es aber mw nicht.

willst du gar handschrift erkennen lassen, musst du schon in die tasche greifen, und was neueres kaufen.

scannen mindestens mit 400 dpi in s/w (besser noch 600 dpi) um möglichst ligaturen zu vermeiden und damit die einzelnen buchstaben deutlich von einander trennen zu können. weil mit zu viel erkannten ligaturen das selbst erstellte wörterbuch unnötig gross würde.
http://de.wikipedia.org/wiki/Ligatur_(Typografie)
 
  • #8
Mein Firefox stuft den brothersoft-Link als gefährlich ein..............
 
  • #10
Meine Empfehlung wäre lieber neuen Scanner mit Inklusiv-OCR-software, z.B. einen Canoscan
 
  • #11
klar,  du hast recht, Microchip.
aber seine frage war nach einer ocr-software, setzt also das vorhandensein eines scanners voraus. finereader war ihm zu teuer. ok, ich bin selbst hartz-IV-empfänger und kann seinen diesbezüglichen einwand gut nachvollziehen.

was bleibt dann noch gross, ausser einer freeware.

dass ocr-software nun ausgerechnet bei neueren, sogar recht preiswerten canon-scannermodellen, dabei ist, und es solche geräte bereits ab 40,-€ gibt (sogar als multifunktionsgerät incl. drucker), sollte hinlänglich bekannt sein (zumal er selbst ständig im inet ist, aber wohl nur auf spezifischen zt. tendenziösen seiten).

und wer beiträge von clasaf in letzter zeit mitgelesen hat, weiss, dass argumente, seien sie noch so vernünftig (vll. gerade deswegen), schwer aufgenommen werden......
 
  • #12
W.E. schrieb:
.......und wer beiträge von clasaf in letzter zeit mitgelesen hat, weiss, dass argumente, seien sie noch so vernünftig (vll. gerade deswegen), schwer aufgenommen werden......
Zumindest auf derartige Kommentare kann ich gerne verzichten.

Ich habe selbst Omnipage 9.0. War bei meinen 1. Scanner 2003 dabei. Ist vor 10 -12 Jahren entwickelt worden. Hat mir durchaus bei manchen Sachen geholfen. Probleme gibt es z.B. bei Seiten mit bestimmten Schriftarten wie Schreibmaschinenseiten, die mit kursiven Typenrad geschrieben sind oder Bücherseiten mit alten (gotischen) Druckschriften.
Die Software, die bei den Scannern (gerade den billigen) beiliegt ist meißtens veraltet. Daher brauche ich keinen Scanner extra kaufen. Die Frage war nach eigener Erfahrung mit diesen Software wie eben z.B. Finereader 7, da ich nicht die Katze im Sack kaufen möchte.
Werde aber mal omnipage-SE ausprobieren.
Wenn es halt nichts passendes preisgünstiges gibt, hat sich die Sache halt für mich erledigt.
gruss clasaf
 
  • #13
clasaf schrieb:
Ich habe selbst Omnipage 9.0. War bei meinen 1. Scanner 2003 dabei. Ist vor 10 -12 Jahren entwickelt worden. Hat mir durchaus bei manchen Sachen geholfen. Probleme gibt es z.B. bei Seiten mit bestimmten Schriftarten wie Schreibmaschinenseiten, die mit kursiven Typenrad geschrieben sind oder Bücherseiten mit alten (gotischen) Druckschriften.
kannst du denn da keine speziellen wörterbücher erstellen? op 9 kenne ich leider nicht. und mein tipp mit der höheren scanauflösung? gerade dadurch kannst du ligaturen bei serifen oder kursiver schrift oft vermeiden.

kannst du mal ein beispiel so einer schrift (als jpg) posten, und die scanauflösung angeben?
 
  • #14
Die Auflösung beträgt 300 dpi. Bei größerer Auflösung, wird die Erkennung eher noch schlechter.
Schrift

@Microchip
OmniPage SE für Scanner und Multifunktionsgeräte von Canon
Auf dieser Seite können Sie für Ihren Canon-Scanner bzw. -Multifunktionsdrucker das OmniPage SE Software-Update für Windows Vista und/oder Internet Explorer 7 anfordern.
Das Update ist nur als Download verfügbar.
WICHTIG
Das Update ist für Scanner und Multifunktionsdrucker von Canon bestimmt, die bereits mit dem Softwarepaket OmniPage SE ausgestattet sind. Sie können das Update also nur installieren, wenn Sie einen Canon-Scanner oder -Multifunktionsdrucker mit einer älteren Version von OmniPage SE besitzen.
Bei Deinen Link oben bekomme ich bei omnipage-SE irgendein anderes Programme, aber nicht das Original. Die Seite ist mir nicht unbedingt koscher.
Sonst habe ich bei google auch keinen weiteren Link zum Download gefunden.
gruss clasaf
 
  • #15
is natürlich->n böser font für ocr...
wie hoch kann dein scanner bei s/w, ev. mit schärfung und, vor allem, moirée ausschalten. (heisst manchmal zeitung, wenn nach der scan-art gefragt wird).

sicherlich ist das auch ein software-problem, clasaf, aber in erster linie ist doch mal deine hardware (sprich dein scanner) und dessen arbeitsoberfläche  entscheidend für ein vernünftiges ocr-ergebnis.

wenn der keine vernünftigen scans liefert, kannst du an software einsetzen, was du willst, es werden immer lange sitzungen mit zweifelhaftem ergebnis (meine erfahrung).
oder eben aktuelle software, aber dann kannst du auch gleich ein komplettangebot kaufen.......

schreib mal noch deine scaneinstellungen in diesem spez. fall. (vll. können wir da was optimieren/ändern)
 
  • #16
Nur der Ordnung halber lieber clasaf,
isch abe gar keinen Link gesetzt und habe ausschließlich einen Rat zu neuem Scanner mit OCR-Softwarebeigabe nach Begutachten der Perlenseite gegeben.
Warum begründe ich dir gerne. Bei einem neuen Scanner liegt die Soft in der Pörlklasse gratis bei (nicht weil die Hersteller so wahnsinnig daran interessiert sind, daß du diese Soft nimmst sondern damit du gleich das schöne Upgradeangebot in Anspruch nimmst, was man specially dir anbietet).
W.E. hat dir bestens beschrieben, daß die Hardware eben doch einen Unterschied macht.
Wenn ein Scanner bei 600 dpi Scanauflösung schlechtere Ergebnisse wie bei 300 dpi liefert dann setzt bei mir die Logik aus. Nichts für ungut, so was ist jenseits von plausibel.
 
  • #17
Die Software kann überhaupt nicht groß auf den Scanner zugreifen. Es sind Schwarz/ Weiß und höchste Genauigkeit eingestellt. Ansonsten sind wohl Standardoptionen eingestellt. Z.B. ohne Moire und geschärft. Der Scanner selbst arbeitet eigentlich sehr gut. Normale Schriften werden auch sehr gut erkannt. Ich wüsste auch nicht, was von obigen Screenshot noch besser sein soll. Stammt vom Scanner. Daher werde ich auch keinen neuen Scanner anschaffen. Zumal, wie ich schon schrieb, die dazugehörige Software zum Teil veraltet ist. Ich werde mal sehen, ob ich den finereader 7 zum ausprobieren erhalte. Danach entscheide ich, ob ich ihn kaufe.


edit @ microchip
Sorry Es ging um den Link von W.E.
Zur Auflösung folgendes. Bei hoher Auflösung werden oft kleine Unregelmäßigkeiten bei Papier oder kleine Farbtüpfelchen, die vom Schreibmaschinenband auf das Papier kommen, sehr stark dargestellt, so dass es beim OCR zu Erkennungsproblemen kommt. Bei älteren Buchseiten ist das noch extremer. Ich habe schon oft genug OCR genutzt und habe da auch meine Erfahrungen.
Einen neuen Scanner zu kaufen, ohne dass ich weiß, dass die OCR-Software meinen Anforderungen entspricht, ist mir zu riskant. Zumal ich bei Scannern unter 100 Euro auch Bedenken hinsichtlich Scanqualität habe.
Ansonsten möchte ich das Thema beenden.
gruß clasaf
 
  • #18
Zur Auflösung folgendes. Bei hoher Auflösung werden oft kleine Unregelmäßigkeiten bei Papier oder kleine Farbtüpfelchen, die vom Schreibmaschinenband auf das Papier kommen, sehr stark dargestellt, so dass es beim OCR zu Erkennungsproblemen kommt. Bei älteren Buchseiten ist das noch extremer. Ich habe schon oft genug OCR genutzt und habe da auch meine Erfahrungen.

deshalb sollst du ja auch keinen graustufen, sondern einen s/w (schwarz/weiss)-scan machen. wenn du dann im histogramm noch den schwarz- und den weiss-wert entsprechend einstellst, hast du auch keine verunreinigungen mehr, zumindest kaum.
 
  • #19
@clasaf,
du verwechselst ganz offensichtlich eine für einen Bildausdruck ausreichende Auflösung mit einer für die Erkennung durch die OCR-Software ausreichenden Auflösung, wobei ich davon ausgehe, daß dein Bildbeispiel vergrössert wurde und im Original kleiner war.
Zu deinen Preisbeispielen und Vorverurteilungen: guck dich doch einfach selbst mal im Netz um was heute ein Scanner zu welchem Preis bietet.
 
  • #20
Das Schwarz/Weiß gescannt wird ist natürlich klar und steht auch oben, ebenso mit höchster Qualiät. Wie schon geschrieben habe, sind keine weiteren Einstellungen möglich und entsprechend der Scanqualität auch nicht nötig.
Dazu Zitat Normale Schriften werden auch sehr gut erkannt. Also ist das gezeigte Beispiel mehr ein Software- als Hardwareproblem.
Zum Scannerpreis noch das Zitat:daß du diese Soft nimmst sondern damit du gleich das schöne Upgradeangebot in Anspruch nimmst, was man specially dir anbietet
Dafür wird man oft auch noch zur Kasse gebeten.
Das wars von mir dazu und ich bitte doch darum, meine (vorläufige) Entscheidung zu akzeptieren.
Auch Zitat: Ansonsten möchte ich das Thema beenden.
gruss clasaf
 
Thema:

(S) OCR-Software

ANGEBOTE & SPONSOREN

Statistik des Forums

Themen
113.840
Beiträge
707.963
Mitglieder
51.494
Neuestes Mitglied
Flensburg45
Oben