Was ist das beste kostenlose OCR- oder ICR-Programm für die Abschrift von Manuskripten?

Was ist das beste kostenlose OCR- oder ICR-Programm für die Abschrift von Manuskripten? / Fragen Sie die Experten

Javier fragt:

Ich schreibe Kurzgeschichten und Erzählungen. Ich suche nach einem kostenlosen optischen Zeichenerkennungsprogramm (OCR) oder einem intelligenten Zeichenerkennungsprogramm (ICR), um meine alten Manuskripte aus Bildern oder Fotos zu scannen, damit ich sie in Microsoft Word-Dateien konvertieren kann.

Gibt es freie und genaue Programme, die dazu in der Lage sind? Leider habe ich keinen Scanner, aber ich habe Zugriff auf eine Digitalkamera mit einer Auflösung von 20 Megapixel.

Kannons Antwort:

Wie Sie bereits erwähnt haben, gibt es verschiedene Arten von Zeichenerkennungstechnologien, mit denen handgeschriebenes oder eingegebenes Schreiben automatisch in digitale Zeichen umgewandelt werden kann. Der Genauigkeitsgrad dieser Arten von Software variiert stark zwischen verschiedenen Implementierungen. Einige konvertieren Buchstaben für Buchstaben und andere können ganze Wörter konvertieren. Es gibt drei allgemeine Kategorien dieser Software:

  • Optische Zeichenerkennung (OCR)
  • Intelligente Zeichenerkennung (ICR)
  • Intelligente Worterkennung (IWR)

Optische Zeichenerkennung

In der Tat handelt es sich bei OCR um einen Oberbegriff, und oft werden alle in diesem Artikel beschriebenen Methoden als OCR - Wikipedia bezeichnet. OCR erhält jedoch eine eigene Klassifizierung. Moderne Implementierungen neigen jedoch dazu, mehrere Methoden zusammenzufassen. Was macht es also? OCR wandelt einzelne Buchstaben oder handschriftliche Buchstaben in digitale Zeichen um. Die Software betrachtet also ein Dokument und versucht, es in Klartext umzuwandeln, indem er herausfindet, was die einzelnen Zeichen sind.

Die Software ist nicht perfekt. OCR-Software kann einzelne Zeichen mit ähnlichen Erscheinungsbildern falsch interpretieren, was zu falsch geschriebenen Wörtern und ungenauen Ausgaben führt. In den meisten Fällen können Benutzer den von einem OCR-Programm generierten Text in ein Textverarbeitungsprogramm kopieren und Rechtschreibfehler automatisch beheben. Oft erscheinen Fehler als ähnliche Zeichen. Zum Beispiel der Brief “d” könnte als dargestellt werden “cl”.

Bei handschriftlichen Texten ist OCR jedoch nicht besonders gut. Zumindest ist die Mehrheit der kostenlosen Implementierungen tragisch schlecht. Es gibt einige kommerzielle Produkte, die dies können Ja wirklich Nagel handgeschriebene Transkription, aber ihre Preise machen sie für die breite Öffentlichkeit völlig außer Reichweite. Zum Beispiel gibt es die ReadSoft OCR-Software von Lexmark. Diese reine Unternehmenssoftware kostet Tausende von Dollar.

Intelligente Zeichenerkennung

ICR ist eine Teilmenge von OCR, die sich auf die Umwandlung von handgeschriebenem Text in einzelne digitale Zeichen spezialisiert. Da Ihre Notizen und Manuskripte von Hand geschrieben werden, ist ein ICR-Programm am nützlichsten. Ich bin mir jedoch nicht sicher, wie genau sie Texte übersetzen können, die in Fremdsprachen wie Spanisch verfasst sind. Wie beim OCR können Benutzer die Qualität der ausgegebenen Texte verbessern, indem Sie sie bei eingeschalteter Rechtschreibkorrektur in ein Textverarbeitungsprogramm kopieren und anschließend das Korrekturlesen von Hand durchführen.

Intelligente Worterkennung

Die neueste Entwicklung von OCR und ICR ist die Intelligent Word Recognition-Software. Anstatt einzelne Zeichen zu erkennen, versucht er, ganze handschriftliche Wörter zu übersetzen. Wie OCR und ICR werden bei der intelligenten Worterkennung Wörter häufig falsch übersetzt, und der Benutzer muss die Fehler manuell korrigieren.

Was ist die beste kostenlose OCR-Software??

Tesseract

Es gibt viele Möglichkeiten. Tesseract ist wahrscheinlich das Beste Open Source (und kostenlose) OCR-Software da draußen. Meines Wissens betrachtet es nur einzelne Zeichen und nicht ganze Wörter.

Da Sie Microsoft Word verwenden (mit der besten, anpassbaren Rechtschreibprüfung) Rechtschreibprüfung und Grammatikprüfung in Microsoft Word Rechtschreibprüfung und Grammatikprüfung in Microsoft Word Sie können die in Microsoft Word integrierten Tools zur Rechtschreibprüfung und Grammatikprüfung entsprechend anpassen Sie können sogar AutoCorrect verwenden, um das Tippen zu beschleunigen. Lesen Sie weiter in den Unternehmen), Sie können einfach den gesamten Text in Word kopieren und dann eine Rechtschreibprüfung durchführen, um Rechtschreibfehler zu bereinigen.

Tesseract ist eigentlich eine OCR-Engine, die von der Kommandozeile aus läuft. Wenn Sie nicht bereit sind, sich mit der Schwierigkeit zu befassen, ein Befehlszeilentool zu verwenden, möchten Sie wahrscheinlich etwas benutzerfreundlicheres installieren. Es gibt einen Download “Vorderes Ende” (oder eine grafische Benutzeroberfläche), mit der Sie Tesseract als Drag & Drop-Tool verwenden können: PDF OCR X. Installieren Sie zuerst das Softwarepaket und führen Sie es aus. Sie sehen dann ein Fenster:

Dann ziehen Sie einfach die Bilddatei in das Fenster. Sobald das Image geladen ist, führen Sie die OCR-Transkriptionssoftware aus. Es kann ungefähr eine Minute dauern.

Leider erwies es sich als völlig unzureichend für die Bearbeitung Ihres Textes. So sieht es nach dem Extrahieren von Text aus dem Dokument aus:

Microsoft OneNote

Da Sie anscheinend bereits Microsoft Office verwenden, ist die beste Option wahrscheinlich auch von Microsoft. Ich vermute, dass Sie eine Kopie von Microsoft Office besitzen, zu der OneNote gehört. Dies ist mit einer ziemlich fortschrittlichen OCR-Technologie ausgestattet.

Sowohl für iOS als auch für Android gibt es auch das vollständig kostenlose Microsoft Office-Objektiv, mit dem JPEG (und andere Bildformate) direkt in Text umgewandelt werden können. Was die mobilen Versionen so wunderbar macht, ist, dass Sie ein Bild aufnehmen, in das Cloud-Computing-System von Microsoft hochladen und dann die Textextraktion aus OneNote auf einem Desktop ausführen können.

Der Prozess ist ziemlich einfach. Machen Sie zuerst ein Foto von Ihrem Text. Wenn Sie sich für die OneNote-App entschieden haben, müssen Sie die Datei nur in Ihrem OneDrive-Konto speichern. Andernfalls übertragen Sie das Bild auf Ihren Computer und legen Sie es auf OneNote ab.

Klicken Sie dann mit der rechten Maustaste auf das Bild und wählen Sie aus Kopieren Text aus Bild aus dem Kontextmenü.

Klicken Sie dann mit der rechten Maustaste auf einen leeren Bereich von OneNote (oder in einer Textleseanwendung) und füge den Text ein. Der ausgegebene Text aus Ihrem Dokument sieht folgendermaßen aus:

Leider funktionieren die Ergebnisse von OneNote nicht irgendwo in der Nähe von einem guten Job, völligen Unsinn produzieren. Dies kann durch eine Kombination von Faktoren verursacht werden, z. B. durch ein verzerrtes Bild oder ein Schreiben, das nicht in einer geraden Linie ausgeführt wird, oder einfach, weil die Software nicht gut genug ist.

Google Keep

Die beste Lösung für OCR in handschriftlichen Dokumenten bezieht sich derzeit auf maschinelles Lernen: Speziell auf das Deep Learning. Beim Deep-Learning handelt es sich um eine ausgereifte Methode, um einen Computer für das Ausführen von Aufgaben zu trainieren, an denen zuvor nur ein Mensch herausragte, beispielsweise die Gesichtserkennung (Picasa führt die Gesichtserkennung durch. So verwenden Sie die Gesichtserkennung in Picasa-Webalben , glaub es oder nicht). Vor kurzem hat Google DeepMind erworben, ein Unternehmen, das tief lernende Technologien entwickelt. Coole Forschungsprojekte, die die Zukunft verändern könnten. Coole Forschungsprojekte, die die Zukunft verändern könnten. Mega-Unternehmen wie Google, Microsoft, IBM und Intel werden künftigen Generationen die Welt bieten, die wir können erst jetzt vorstellen? Diese spannenden Forschungsprojekte sagen, dass es ein Versprechen ist, das sie halten werden. Weiterlesen . Diese Schlüsselakquisition hatte einen großen Effekt: Microsoft verliert in der OCR an Google Microsoft vs. Google - Wer führt das Künstliche Intelligenzrennen an Microsoft vs Google - Wer führt die Künstliche Intelligenz? Forscher der künstlichen Intelligenz machen spürbare Fortschritte, und die Menschen beginnen wieder ernsthaft über die KI zu sprechen. Die beiden Titanen, die das Rennen über künstliche Intelligenz anführen, sind Google und Microsoft. Weiterlesen . Derzeit bietet Google eine der fortschrittlichsten (und kostenlosen) Methoden an: Google Keep.

Google Keep (was wir 2013 erstmals überprüft haben. Einfache Notizen für unterwegs: Google Keep für Android überprüft. Einfache Notizen für unterwegs: Google Keep für Android überprüft. Es gibt ein paar erstaunliche Apps zum Mitnehmen von Notizen, aber hier ist eine, die einen genaueren Blick verdient : Google Keep, ein Notizhalter, der sowohl eine großartig aussehende Android-App als auch eine glatte Web-App hat (Read More), bietet auch eine mobile Version ihrer App für Android an. Wie bei OneNote können Sie das Bild aufnehmen und direkt in die Cloud von Google übertragen. Ziehen Sie das Bild einfach in das Google Keep-Fenster. Klicken Sie dann auf die Menüschaltfläche (drei vertikale Punkte) und wählen Sie aus Schnappen Sie sich Bildtext aus dem Kontextmenü.

So sieht es nach dem Extrahieren des Textes aus:

Google hält Gewinne

Wie Sie sehen, dominiert Google Keep die Konkurrenz. Die Ergebnisse können noch weiter verbessert werden, indem Sie ein Bildbearbeitungstool verwenden. 10 kostenlose Foto-Editor-Werkzeuge für eine optimale Aufnahme Ihrer Fotos 10 kostenlose Foto-Editor-Werkzeuge für eine optimale Bildqualität Was auch immer mit den Schnappschüssen passiert ist, die Sie in der Vergangenheit aufgenommen haben ? Wenn Sie Pläne und Ideen haben, finden Sie hier einige großartige Windows- und plattformübergreifende Tools, mit denen Sie diese bearbeiten können. Lesen Sie mehr, um den Kontrast zu erhöhen und das Bild zu glätten.

Hoffentlich helfen diese Optionen. Wenn Sie mehr OCR-Optionen benötigen, schauen Sie sich die 5 besten OCR-Tools an. Die 5 besten OCR-Tools zum Extrahieren von Text aus Bildern Die 5 besten OCR-Tools zum Extrahieren von Text aus Bildern Wenn Sie unzählige Seiten Papier haben, wie wird alles gedruckt? Text in etwas konvertiert, das ein digitales Programm erkennen und indizieren kann? Bewahren Sie eine gute OCR-Software in der Nähe auf. Weitere Informationen finden Sie hier.

Erfahren Sie mehr über: OCR, Transkription.