Wissenschaft

Was ist ocr? »Seine Definition und Bedeutung

Anonim

OCR sind solche der optischen Zeichenerkennung oder im Spanischen auch als optische Zeichenerkennung bekannt. OCR ist eine Software, die die Texterkennung ermöglicht, indem ein Bild davon erstellt wird, um es in eine Folge von Zeichen umzuwandeln, und diese dann in einem bestimmten Format speichert, das in diesen Textbearbeitungsprogrammen verwendet werden kann. Mit anderen Worten, dank dieser neuen Technologie kann jede Art von Text oder Dokument, einschließlich PDF-Dateien, gescanntem Papier oder sogar Bildern, die von Digitalkameras aufgenommen wurden, in Daten konvertiert werden, um die Möglichkeit zu haben, bearbeitet zu werden.

Diese Software funktioniert folgendermaßen: Zuerst analysiert sie jeden Teil des Bildes des betreffenden Dokuments. Verteilen Sie die Seite unter anderem in Tabellen, Bildern und Textblöcken. dann werden die Zeilen in Wörtern verteilt, um später Zeichen zu werden; und da die Zeichen bereits angegeben wurden, führt die Software den Vergleich mit einer Gruppe von Bildern des Musters durch. Dies schreitet gemäß der Reihe von Hypothesen darüber voran, was jedes Zeichen ist; Basierend auf diesen Hypothesen werden die verschiedenen Varianten des Aufbrechens von Linien in Wörter und Wörter in Zeichen analysiert. Und nach einer Vielzahl von Analysen und Verarbeitungen der Hypothesen präsentiert das Programm endlich den bereits erkannten und transformierten Text in einem neuen Format.

Es sollte beachtet werden, dass es heute eine Reihe von Programmen gibt, die der Computermarkt basierend auf OCR anbietet, wie OmniPage, Abbyy Fine Reader oder READiris. YY, die die Fähigkeit haben, nicht nur einen Text als solchen zu analysieren und zu erkennen, sondern auch das Format und den Stil zu erkennen, jedoch mit bestimmten Einschränkungen, sodass der Text nach der Analyse bearbeitet werden muss, um die entsprechenden Anpassungen vorzunehmen benötigen.