Text Unerkennung. Gratis Programm - Analog vu FineReader

Pin
Send
Share
Send

Fréier oder spéider, jiddereen deen dacks mat Büroprogrammer schafft, steet géint eng typesch Aufgab - fir Text aus engem Buch, Zäitschrëft, Zeitung, einfach Broschüren ze scannen an dës Fotoen dann an Textformat ze iwwersetzen, zum Beispill, an e Word Dokument.

Fir dëst ze maachen, brauch Dir e Scanner an e spezielle Programm fir den Text ze erkennen. Dësen Artikel gëtt iwwer de fräien Amtskolleg vu FineReader diskutéieren -Cuneiform (iwwer d'Unerkennung am FineReader - kuckt dësen Artikel).

Fänken mer un ...

Inhalt

  • 1. Feature vum CuneiForm Programm, Features
  • 2. Beispill vun Texterkennung
  • 3. Batch Text Unerkennung
  • 4. Conclusiounen

1. Feature vum CuneiForm Programm, Features

Cuneiform

Dir kënnt et vum Site vum Entwéckler eroflueden: //cognitiveforms.com/

En Open Source Text Unerkennung Programm. Zousätzlech funktionnéiert et an all Versioune vu Windows: XP, Vista, 7, 8, wat et gefält. Plus, füügt déi voll russesch Iwwersetzung vum Programm un!

Virdeeler:

- Textherkennung an den 20 beléifste Sprooche vun der Welt (Englesch a Russesch vu sech ass an dëser Nummer abegraff);

- Enorme Support fir verschidde Printfonten;

- préift de Wierderbuch vun unerkannten Text;

- d'Fäegkeet Aarbechtsresultater op verschidde Weeër ze spueren;

- Erhaalung vun der Struktur vum Dokument;

- Grouss Ënnerstëtzung an Dëscherkennung.

Nodeeler:

- ënnerstëtzt net ze grouss Dokumenter an Dateien (méi wéi 400 dpi);

- Ënnerstëtzt net direkt verschidden Aarte vu Scanner (gutt, et ass net sou vill, e spezielle Scannerprogramm ass mat de Scannerdreiwer enthale);

- den Design blénkt net (awer wien brauch et wann de Programm de Problem voll léist).

2. Beispill vun Texterkennung

Mir huelen un datt Dir scho déi néideg Biller fir d'Unerkennung kritt hutt (do gescannt, oder e Buch am pdf / djvu Format am Internet erofgelueden an déi néideg Biller vun hinnen erausgeholl hunn. Fir wéi Dir dëst maacht, kuckt dësen Artikel).

1) Öffnet dat gewënschte Bild am CuineForm Programm (Datei / opmaachen oder "Cntrl + O").

2) Fir d'Unerkennung unzefänken - Dir musst éischt verschidde Beräicher auswielen: Text, Biller, Tabellen, asw. Am Cuneiform Programm kann dëst net nëmme manuell gemaach ginn, awer och automatesch!!! Fir dëst ze maachen, klickt op de "Layout" Knäppchen an der Top Panel vun der Fënster.

3) No 10-15 Sekonnen. De Programm wäert automatesch all Beräicher mat verschiddene Faarwen ervirhiewen. Zum Beispill gëtt en Textberäich blo agezeechent. Iwwrégens, si beliicht all Beräicher korrekt an zimlech séier. Éierlech, hunn ech net sou eng séier a korrekt Reaktioun vun hatt erwaart ...

4) Fir déi déi den automateschen Layout net vertrauen, kënnt Dir manuell benotzen. Fir dëst ze maachen, gëtt et eng Toolbar (kuckt d'Bild hei ënnen), mat deem Dir kënnt wielen: Text, Dësch, Bild. Beweegt, vergréissert / reduzéiert d'initial Bild, haalt d'Kanten. Am Allgemengen e gudde Set.

5) Nodeem all Gebidder gezeechent sinn, kënne mir weidergoen UnerkennungAn. Fir dëst ze maachen, klickt einfach op de Knäppchen mam selwechten Numm, wéi op der Foto hei ënnen.

6) Literal an 10-20 Sekonnen. Dir gesitt en Dokument am Microsoft Word mat unerkannten Text. Interessant datt am Text fir dëst Beispill natierlech et waren Feeler, awer et gi ganz wéineg vun hinnen! Ausserdeem, wann Dir bedenkt a wéi enger unprepossessing Qualitéit d'Quellmaterial war - e Bild.

D'Geschwindegkeet an d'Qualitéit si ganz vergläichbar mat FineReader!

3. Batch Text Unerkennung

Dës Programmsfunktioun kann praktesch kommen wann Dir net ee Bild erkennt, awer e puer gläichzäiteg. D'Ofkiirzung fir d'Batch Unerkennung ze starten ass normalerweis am Startmenu verstoppt.

1) Nodeems Dir de Programm opgemaach hutt, musst Dir en neie Package erstellen, oder e virdru gespäicherten opmaachen. An eisem Beispill erstellt en neit.

2) An der nächster Etapp gi mir en Numm, am léifsten een deen erënnert wat et 6 Méint méi spéit an him gespäichert ass.

3) Als nächst wielt d'Dokumentsprooch (Russesch-Englesch), gitt un ob et Biller an Dëscher an Ärem gescanntem Material sinn.

4) Elo musst Dir den Ordner spezifizéieren an deem d'Dateien fir d'Unerkennung sinn. Iwwregens, wat interessant ass, de Programm selwer fënnt all d'Fotoen an aner grafesch Dateien, déi e kann erkennen a se an de Projet derbäigesat. Dir musst just den Extra erofhuelen.

5) De nächste Schrëtt ass net wichteg - wielt wat Dir mat de Quelldateien maache wëllt, no der Unerkennung. Ech recommandéieren, Dir de Schreifbox "Näischt maachen" ze wielen.

6) Et bleift nëmmen de Format ze wielen an deem d'Unerkannt Dokument gespäichert gëtt. Et ginn e puer Optiounen:

- rtf - eng Datei vun engem Wuertdokument, vun alle populäre Büroen opgemaach (inklusiv gratis, e Link zu Programmer);

- txt - Textformat, Dir kënnt nëmmen Text drop späicheren, Fotoen an Dëscher kënnen net sinn;

- htm - eng Hypertext Säit, praktesch wann Dir Dateien fir de Site scannt an erkennt. Mir wäerte et an eisem Beispill auswielen.

7) Nodeems Dir op de "Fäerdeg" Knäppchen geklickt hutt, fänkt de Prozess vun Ärem Projet un.

8) De Programm funktionnéiert zimmlech séier. No der Unerkennung erschéngt e Tab mat htm Dateien virun Iech. Wann Dir op sou eng Datei klickt, fänkt e Browser un, wou Dir d'Resultater gesitt. Iwwrégens, de Pak kann gespuert gi fir weider Aarbecht mat der.

9) Wéi Dir gesitt, d'Resultater d'Aarbecht ass ganz beandrockend. De Programm huet d'Bild einfach erkannt, an ënner et war den Text einfach ze erkennen. Trotz der Tatsaach datt de Programm gratis ass, ass et meeschtens super!

4. Conclusiounen

Wann Dir dacks Dokumenter net scannt an erkennt, da kaaft de FineReader Programm kaaft net Sënn. Déi meescht Aufgaben gi ganz einfach vum CuneiForm.

Op der anerer Säit huet si och Nodeeler.

Als éischt ginn et ze wéineg Tools fir d'Resultat z'änneren an ze kontrolléieren. Zweetens, wann Dir vill Biller erkenne musst, ass et méi bequem am FineReader fir direkt alles ze gesinn, wat zum Projet an der Kolonn uewe bäigefüügt ass: séier onnéideg läschen, Korrekturen maachen, asw. An drëttens verléiert CuneiForm als Unerkennung op Dokumenter: Ech muss d'Dokument a Gedanken bréngen - Feeler änneren, Punktuéierungsmarken, Zitatzeechen asw.

Dat ass alles. Wësst Dir en anert wäertvollt gratis Texterkennungsprogramm?

Pin
Send
Share
Send