Testbericht OCR Software zur Texterkennung - Nuance Omnipage 16 pro vs. Abbyy Finereader 9

An dieser Stelle geht es nicht um detaillierte Produktbeschreibungen der genannten OCR Programme. Vielmehr sollen zwei preislich im selben Segment liegende Programme zur Texterkennung pragmatisch verglichen werden. Wer kann was besser in welcher Disziplin?

Am Anfang optimierte ich den Scanvorgang. Der erste Test wurde mit einem vorbildlichen Dokument vollzogen. Ich trennte die Buchseite aus dem Buch heraus und erhielt so einen ordentlichen Scan. Sauber eingescannt, keine schiefe Seite. Der Hintergedanke dabei: OCR Programme zur Texterkennung haben bestimmt Probleme mit unsauber eingescannten Seiten. Das Resultat: Die OCR Software von Abbyy (FineReader 9) und Nuance (Omnipage 16 professional) erkannten eine Seite mit Text in 2 Spalten anstandslos. FineReader 9 war langsamer als Omnipage 16 professional, aber das Ergebnis kann sich blicken lassen. Die einzigen "Fehler", wenn es solche sind, wurden bei Omnipage 16 durch die genutzte "Word-Rechtschreibprüfung" beanstandet. Man muss wissen: OmniPage 16 nutzt die Rechtschreibprüfung von Microsoft Word. Und wenn dort ein Wort unbekannt ist, oder es nicht der neuen Rechtschreibung folgt, meckert Word natürlich.

Aber es kann gesagt werden: Bei einer guten Scannvorlage, wo nichts schief hängt und mit 300 DPI gescannt wurde, liefern beide OCR Programme eine vorbildliche Texterkennung. Da gibt es, für "Normalanwender", nichts zu meckern. Ob die beiden OCR Programme bei professionellen Nutzern super abschneiden, kann ich nicht beurteilen. Ich habe nicht vor, eine komplette Bibliothek zu scannen.

Aber eines muss ich sagen: Das OCR Programm von Abby, FineReader 9, ist einfacher zu handhaben als die Texterkennungssoftware von Nuance, Omnipage 16 professional. Was aber auch bedeutet, bei Omnipage 16 hast Du mehr Einstellmöglichkeiten. Aber am Ende entscheidet das Resultat. Und da sind bei vorbildlich eingescannten Seiten beide auf Augenhöhe.

Im zweiten Test wurde ein Buch auf den Flachbettscanner gelegt. Das ist wohl der Fall, mit dem die Meisten konfrontiert werden. Wer will schon aus einem Buch Seiten heraus zupfen, nur damit der Scann sauber wird? Also ein Altes DDR Buch genommen, ein Bildband über Ungarn. Auf die Scheibe geknallt, nach bestem Gewissen ordentlich ausgerichtet und eingescannt.
Wie es aber bei dem scannen von Büchern üblich ist - Das Buch mit all seinen Blättern fügt sich nicht immer dem Willen des Scanners. Die eingescannte Seite war schief, zum Rand hin wurde es dunkler. Oh wehe. Das kann nicht gut gehen, dachte ich.

Zuerst jagte ich die eingescannte Seite durch die Texterkennung von Abbyy's FineReader 9. He, und das Ergebnis war für mein Empfinden gut. Text trotz Schieflage erkannt, halbwegs ordentlich in Word formatiert ausgegeben. Der komplizierte Header war nicht originalgetreu, die Schrift zu sehr angeklatscht. Aber ich war erstaunt, dass Abbyy's FineReader 9 selbst bei einem schiefen Scann mit dunklen Randbereichen überhaupt etwas fehlerfrei erkennt.

Doch der Hammer ist Omnipage 16 professional. Das gespeicherte Word Dokument sieht 100% aus wie die originale Buchseite. Die Überschrift perfekt wiedergegeben, die verschiedenen Schriften im Text, sowie das Layout der Buchseite - perfekt!

Die OCR Texterkennung von Omnipage 16 pro ist komplizierter zu handhaben. Aber die Texterkennung von OmniPage 16 liefert bei nicht perfekten Scanns bessere und schnellere Ergebnisse als Abbyy mit FineReader 9.

Die OCR Software von FineReader als auch Omnipage kann direkt aus digitalen Fotos eine Texterkennung vornehmen. Wobei Omnipage schneller ist. Überhaupt liefert Omnipage gleich Statistiken zum Job aus.

Also ich sage: Die OCR Software zur Texterkennung mit Omnipage 16 (17) professional ist Abbyy vorzuziehen.