Texti viðurkenning hugbúnaður

Sem reglu, þegar það kemur að forritum til viðurkenningar á skönnuðri texta (OCR, sjónræn stafræna viðurkenningu), muna flestir notendur eina vöru - ABBYY FineReader, sem án efa er leiðandi meðal slíkrar hugbúnaðar í Rússlandi og einn af leiðtoga heims.

Engu að síður er FineReader ekki eini lausnin af þessu tagi: það eru ókeypis forrit til að fá aðgang að texta, netþjónustu í sömu tilgangi og að auki eru slíkar aðgerðir einnig til staðar í sumum kunnuglegum forritum sem kunna að hafa verið settar upp á tölvunni þinni . Ég mun reyna að skrifa um allt þetta í þessari grein. Öll hugsuð forrit vinna í Windows 7, 8 og XP.

Texti viðurkenning Leader - ABBYY Finereader

Um FineReader (áberandi sem Fine Reader) heyrt, líklega, flestir af þér. Þetta forrit er besta eða ein besta til að fá hágæða textakennslu á rússnesku. Forritið er greitt og verð leyfis til notkunar heima er aðeins minna en 2000 rúblur. Einnig er hægt að hlaða niður prufuútgáfu FineReader eða nota textaauglýsingu á netinu í ABBYY Fine Reader Online (þú getur viðurkennt nokkrar síður ókeypis, þá - gegn gjaldi). Allt þetta er í boði á opinberu verktaki vefsíðunnar //www.abbyy.ru.

Að setja upp prufuútgáfu FineReader valdi ekki neinum vandræðum. Hugbúnaðurinn getur samlaga með Microsoft Office og Windows Explorer til að auðvelda að keyra viðurkenningu. Af takmörkunum á ókeypis prufuútgáfu - 15 daga notkun og hæfni til að viðurkenna ekki meira en 50 síður.

Skjámynd til að prófa viðurkenningarhugbúnað

Þar sem ég er ekki með skanni notaði ég myndskot af myndavél með lélegri gæðum, þar sem ég breytti örlítið smáskýringu til að athuga. Gæðin er ekki góð, við skulum sjá hver getur séð það.

Valmynd FineReader

FineReader getur fengið grafíska mynd af textanum beint frá skanna, úr grafískri mynd eða myndavélinni. Í mínu tilfelli var nóg að opna myndskrána. Ég var ánægður með niðurstöðuna - bara nokkrar mistök. Ég segi strax að þetta sé besta afleiðing allra prófaðra forrita þegar unnið er með þetta sýnishorn - svipuð viðurkenningargildi var aðeins á ókeypis vefþjónustunni Free Online OCR (en í þessari umfjöllun erum við aðeins að tala um hugbúnað, ekki á netinu viðurkenningu).

Niðurstaðan af textaritun í FineReader

Frankly, FineReader hefur sennilega enga keppinauta fyrir Cyrillic texta. Kostir áætlunarinnar eru ekki aðeins gæði viðurkenningar texta heldur einnig víðtæk virkni, formatting stuðningur, hæfur útflutningur í margar snið, þar á meðal Word docx, pdf og aðrar aðgerðir. Þannig að ef OCR verkefni er eitthvað sem þú ert stöðugt að lenda á, þá ekki sjá eftir tiltölulega lítið magn af peningum og það mun borga: þú munt spara miklum tíma, fljótt að fá góða niðurstöðu í FineReader. Við the vegur, ég auglýsa ekki neitt - ég held virkilega að þeir sem þurfa að þekkja meira en tugi síður ættu að hugsa um að kaupa slíka hugbúnað.

CuneiForm er ókeypis texti viðurkenning program.

Að mínu mati er önnur vinsælasta OCR forritið í Rússlandi frjálst CuneiForm, sem hægt er að hlaða niður af opinberu síðu //cognitiveforms.ru/products/cuneiform/.

Uppsetningin á forritinu er líka mjög einföld, það reynir ekki að setja upp hugbúnað frá þriðja aðila (eins og ókeypis hugbúnaður). Viðmótið er nákvæm og skýr. Í sumum tilvikum er auðveldasta leiðin til að nota töframaðurinn, sem er fyrsti táknin í valmyndinni.

Með sýninu sem ég notaði í FineReader, tókst forritið ekki að takast á við, eða nákvæmari, gaf út eitthvað illa læsilegt og brot af orðum. Síðari tilraunin var gerð með skjámynd af texta frá þessari áætlunarflugi, en þó þurfti að auka hana (það þarf að skanna með upplausn 200dpi og hærra, lesið ekki skjámyndir með leturbreiddum 1-2 punkta). Hér gerði hún vel (sum textinn var ekki þekktur, þar sem aðeins Russian var valinn).

CuneiForm textaritun

Þannig getum við gert ráð fyrir að CuneiForm sé eitthvað sem þú ættir að reyna, sérstaklega ef þú ert með hágæða skannaðar síður og þú vilt viðurkenna þá ókeypis.

Microsoft OneNote - forrit sem þú getur nú þegar haft

Í Microsoft Office, sem hefst með útgáfu 2007 og endar með núverandi, 2013, er forrit til að taka minnispunkta - OneNote. Það hefur einnig texta viðurkenningu lögun. Til þess að nota það skaltu einfaldlega líma skannað eða önnur textasnið inn í minnismiðann, hægrismella á það og nota samhengisvalmyndina. Ég huga að sjálfgefið fyrir viðurkenningu er stillt á ensku.

Viðurkenning í Microsoft OneNote

Ég get ekki sagt að textinn sé viðurkenndur fullkomlega, en eins og ég get sagt er það nokkuð betri, jafnvel en í CuneiForm. Auk forritið, eins og áður hefur verið nefnt, er það með mikilli líkur að það sé þegar uppsett á tölvunni þinni. Þó að sjálfsögðu sé notkun þess ef þörf er á að vinna með fjölda skannaðra skjala ólíklegt að það sé þægilegt, heldur er það hentugt fyrir fljótur viðurkenningu á nafnspjöldum.

OmniPage Ultimate, OmniPage 18 - verður eitthvað mjög flott

Ég veit ekki hversu góð OmniPage textaritunarhugbúnaðurinn er: það eru engar prófunarútgáfur, ég vil ekki hlaða niður því einhvers staðar. En ef verð hennar er réttlætanlegt og það mun kosta um 5.000 rúblur í útgáfu fyrir einstök notkun og ekki Ultimate þá ætti þetta að vera eitthvað áhrifamikið. Program Page: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

OmniPage hugbúnaður verð

Ef þú lest eiginleikana og dóma, þar með taldar þær í rússnesku útgáfum, munu þeir hafa í huga að OmniPage veitir í raun hágæða og nákvæma viðurkenningu, þar á meðal á rússnesku, það er tiltölulega auðvelt að taka í sundur ekki hæstu skannanir og veita viðbótarverkfæri. Af gallunum er ekki þægilegt, sérstaklega fyrir nýliði, tengi. Engu að síður, á Vesturmarkaði, er OmniPage bein keppandi af FineReader og í enskum tungumálum eru þeir að berjast einmitt á milli þeirra og því held ég að forritið ætti að vera verðugt.

Þetta eru ekki allar áætlanir af þessu tagi, það eru einnig ýmsar möguleikar fyrir lítil frjáls forrit en á meðan ég reyndi við þá fann ég tvær helstu ókostir sem felast í þeim: Skortur á Cyrillic stuðningi eða öðruvísi, ekki mjög gagnlegur hugbúnaður í uppsetningarbúnaðinum og ákvað því að minnast á þá hérna