Dësen Artikel wäert en Zousaz zum Virege sinn (//pcpro100.info/skanirovanie-teksta/), a méi detailléiert wäert d'Essenz vun der direkter Texterkennung weisen.
Loosst eis mat der ganz Essenz ufänken déi vill Benotzer net ganz verstoen.
Nodeems Dir e Buch, Zeitung, Magazin asw gescannt hutt, kritt Dir eng Rei Biller (d.h. Grafikdateien, net Textdateien), déi Dir musst an engem spezielle Programm erkennen (ee vun de Beschten dofir ass ABBYY FineReader). Erkennung - dat ass et, de Prozess fir Text aus Grafiken ze kréien, an et ass dëse Prozess dee mir méi detailléiert beschreiwen.
A mengem Beispill huelen ech e Screenshot vun dësem Site an probéieren en Text dovun ze kréien.
1) Ouverture vun enger Datei
Öffnen d'Biller (en) op déi mir plangen ze erkennen.
By the way, et sollt hei bemierkt ginn datt Dir net nëmmen Bildformate opmaache kënnt, awer och, zum Beispill, DJVU an PDF Dateien. Dëst erlaabt Iech séier dat ganzt Buch ze erkennen, wat am Netz normalerweis an dëse Formater verdeelt gëtt.
2) Ännerung
Direkt d'accord mat der Auto-Unerkennung mécht net vill Sënn. Wann Dir natierlech e Buch hutt an deem et nëmmen Text gëtt, et gi keng Biller a Platen, plus et ass an exzellent Qualitéit gescannt, da kënnt Dir. An anere Fäll ass et besser all Beräicher manuell ze setzen.
Normalerweis musst Dir als éischt onnéideg Gebidder vun der Säit läschen. Fir dëst ze maachen, klickt op den Edit Knäppchen op der Panel.
Da musst Dir nëmmen d'Uertschaft verloosse mat där Dir méi laang wëllt schaffen. Fir dëst ze maachen, gëtt et e Tool fir onerwënscht Grenzen ze trimmen. An der rietser Kolonn, wielt de Modus kropen.
Als nächst wielt de Beräich deen Dir wëllt verloossen. Op der Bild hei ënnendrënner ass et rout rout.
Iwwrégens, wann Dir e puer Biller opmaacht, da kënne Croping op all Biller gläichzäiteg ugewannt ginn! Bequemlech net eenzel ze schneiden. W.e.g. notéiert, um Enn vun dësem Panel gëtt et nach en anert super Tool -eraserAn. Wann Dir et benotzt, kënnt Dir ongewollte Flecken, Säitennummeren, Speechen, onnéideg Spezial Zeechen an eenzel Sektiounen aus dem Bild läschen.
Nodeems Dir op d'Kante geklickt hutt, sollt Äert Original Bild änneren: nëmmen d'Aarbechtsberäich bleift.
Da kënnt Dir den Image Editor erausgoen.
3) Highlighting Gebidder
Op der Panel uewen iwwer dat oppent Bild sinn et kleng Rechtecker déi d'Scannenberäich definéieren. Et ginn e puer vun hinnen, kuerz als déi meescht üblech.
Foto - de Programm wäert dëst Gebitt net unerkennen, et kopéiert einfach de spezifizéierte Rechteck a paste se an dat unerkannt Dokument.
Text ass den Haaptberäich op deem de Programm wäert fokusséieren a probéiert Text aus dem Bild ze kréien. Dëse Beräich wäerte mir an eisem Beispill ervirhiewen.
No der Auswiel ass d'Géigend a Liichtgréng gemoolt. Da kënnt Dir op de nächste Schrëtt weidergoen.
4) Texterkennung
Nodeems all Gebidder definéiert sinn, klickt op den Erkennen Kommando am Menu. Glécklecherweis ass näischt anescht an dësem Schrëtt gebraucht.
D'Erkennungszäit hänkt vun der Zuel vun de Säiten an Ärem Dokument an der Kraaft vum Computer of.
Am Duerchschnëtt, eng voll Säit gescannt a gudder Qualitéit dauert 10-20 Sekonnen. duerchschnëttlech PC Kraaft (no de Standarde vun haut).
5) Feeler beim Schecken
Wat och ëmmer déi initial Qualitéit vun de Biller ass, Feeler bleiwen ëmmer ëmmer nom Unerkennung. Allerdengs ass bis elo kee Programm mënschlech Aarbecht komplett ausgeschloss.
Klickt op d 'Iwwerpréiwung Optioun an ABBYY FineReader fänkt un Iech eent zu engem ze weisen déi Plazen am Dokument wou et gestoppt ass. Är Aufgab, d'original Bild ze vergläichen (iwwregens, op dëser Plaz wäert se Iech an enger erweiterter Versioun weisen) mat der Erkennungsoptioun - beäntweren äntwerend, oder korrigéieren oder stëmmen. Da geet de Programm op déi nächst schwiereg Plaz an esou weider bis dat ganzt Dokument gepréift gëtt.
Allgemeng kann dëse Prozess laang a langweileg sinn ...
6) Spueren
ABBYY FineReader bitt verschidde Méiglechkeeten fir Är Aarbecht ze spueren. Déi am meeschte benotzt een ass déi "exakt Kopie". D.h. dat ganzt Dokument, den Text an et, sou wéi an der Quell formatéiert ginn. Eng praktesch Optioun fir en op Word ze transferéieren. Sou hu mir an dësem Beispill gemaach.
Duerno gesitt Dir Ären unerkannten Text an engem vertraute Word-Dokument. Ech mengen et huet net vill Sënn fir weider ze molen wat et ze maachen ass ...
Also hu mir e konkret Beispill gemaach wéi ee Bild an en einfachen Text iwwersetzt. Dëse Prozess ass net ëmmer einfach a séier.
Op alle Fall hänkt alles vun der Quellbildqualitéit of, Är Erfahrung a Computergeschwindegkeet.
Gitt eng gutt Aarbecht!