Greindu texta í PDF skjal á netinu.


Það er ekki alltaf hægt að draga texta úr PDF-skrá með hefðbundinni afritun. Oft eru síður slíkra skjala skannað innihald útgáfur blaðsins. Til að umbreyta slíkum skrám í fullkomlega editable textagögn eru sérstök forrit með OCR-virkni (Optical Character Recognition) notuð.

Slíkar lausnir eru mjög erfitt að innleiða og kosta því mikið af peningum. Ef þú þarft að viðurkenna texta með PDF reglulega er ráðlegt að kaupa viðeigandi forrit. Í mjög sjaldgæfum tilvikum væri rökrétt að nota einn af tiltækum netþjónustu með svipuðum aðgerðum.

Hvernig á að viðurkenna texta úr PDF á netinu

Auðvitað er OCR-netþjónustusniðið takmarkað í samanburði við fullt skrifborð lausnir. En þú getur unnið með slíkar auðlindir annaðhvort ókeypis eða fyrir nafnverði. The aðalæð hlutur er að samsvarandi vefur umsókn takast á við helstu verkefni þeirra, þ.e. texta viðurkenningu, eins og heilbrigður.

Aðferð 1: ABBYY FineReader Online

Þjónustufyrirtækið er einn af leiðtoga á sviði sjónrænna viðurkenningar. ABBYY FineReader fyrir Windows og Mac er öflug lausn til að breyta PDF í texta og vinna með það.

Vefur hliðstæða af the program, auðvitað, er óæðri því í virkni. Engu að síður getur þjónustan greint texta frá skannum og myndum á meira en 190 tungumálum. Styður umbreytingu PDF skrár í skjöl Word, Excel, o.fl.

ABBYY FineReader Online þjónusta á netinu

  1. Áður en þú byrjar að vinna með tólið, stofnaðu reikning á síðuna eða skráðu þig inn með Facebook, Google eða Microsoft reikningnum þínum.

    Til að fara í innskráningar gluggann skaltu smella á hnappinn. "Innskráning" í efstu valmyndastikunni.
  2. Þegar þú hefur skráð þig inn skaltu flytja inn viðeigandi PDF skjal í FineReader með því að nota hnappinn "Hlaða upp skrám".

    Smelltu síðan á "Veldu símanúmer" og tilgreindu viðkomandi streng fyrir textaaðkennslu.
  3. Næst skaltu velja tungumálin sem eru til staðar í skjalinu, sniði skráarinnar sem er að finna og smelltu á hnappinn "Viðurkenna".
  4. Eftir vinnslu, sem lengst fer algjörlega eftir stærð skjalsins, getur þú sótt lokið skrá með textaupplýsingum einfaldlega með því að smella á nafnið sitt.

    Eða flytja það út í einn af tiltæku skýjunum.

Þjónustan er aðgreind, líklega, með nákvæmustu texta viðurkenningar reiknirit í myndum og PDF skrám. En því miður er notkun hennar takmarkaður við fimm síður sem eru unnin á mánuði. Til að vinna með fleiri voluminous skjölum þarftu að kaupa eitt ár áskrift.

Hins vegar, ef OCR-aðgerðin er nauðsynleg mjög sjaldan, er ABBYY FineReader Online frábær valkostur fyrir útdrátt texta úr litlum PDF-skrám.

Aðferð 2: Free Online OCR

Einföld og þægileg þjónusta til að stafræna texta. Án þess að skráningin leyfir auðlindinni að þekkja 15 fullan PDF-síður á klukkustund. Free Online OCR vinnur að fullu með skjölum á 46 tungumálum og styður án leyfis þrjú textaútflutningsform - DOCX, XLSX og TXT.

Þegar skráning er notandinn fær um að vinna úr mörgum skjölum, en ókeypis númer þessara síða er takmörkuð við 50 einingar.

Ókeypis Online OCR vefþjónustu

  1. Til að viðurkenna texta úr PDF sem "gestur", án heimildar á vefsíðunni, notaðu viðeigandi eyðublaðið á forsíðu vefsvæðisins.

    Veldu viðeigandi skjal með því að nota hnappinn "Skrá", tilgreindu helstu texta tungumál, framleiðsla snið, þá bíddu eftir að skráin hlaða og smelltu "Umbreyta".
  2. Í lok stafrænnar vinnslu, smelltu á "Hlaða niður útgangsskrá" Til að vista lokið skjalið með textanum á tölvunni.

Fyrir viðurkennda notendur er röð aðgerða nokkuð öðruvísi.

  1. Notaðu hnappinn "Skráning" eða "Innskráning" í efstu valmyndalistanum til, í sömu röð, búðu til reikning Free Online OCR eða farðu í það.
  2. Haltu inni takkanum eftir að hafa fengið heimild í viðurkenningartöflunni "CTRL", veldu allt að tvö tungumál heimildarskjalsins frá listanum sem gefinn er upp.
  3. Tilgreindu frekari valkosti til að vinna texta úr PDF og smelltu á hnappinn. "Veldu skrá" til að hlaða skjalinu inn í þjónustuna.

    Þá, til að hefja viðurkenningu, smelltu á "Umbreyta".
  4. Eftir vinnslu skjalsins, smelltu á tengilinn með nafni framleiðslugjaldsins í samsvarandi dálki.

    Greinarniðurstöðurnar verða strax geymdar í minni tölvunnar.

Ef þú þarft að þykkni texta úr litlu PDF skjali, geturðu örugglega gripið til notkunar tækisins sem lýst er hér að ofan. Til að vinna með stórum skrám þarftu að kaupa fleiri tákn í Free Online OCR eða grípa til annarrar lausnar.

Aðferð 3: NewOCR

Algjörlega frjáls OCR-þjónusta sem gerir þér kleift að draga texta úr nánast öllum grafískum og rafrænum skjölum eins og DjVu og PDF. Úrræði setur ekki takmarkanir á stærð og fjölda þekkta skráa, þarf ekki skráningu og býður upp á fjölbreytt úrval af tengdum aðgerðum.

NewOCR styður 106 tungumál og er hægt að meðhöndla jafnvel litla skjalaskannanir. Hægt er að velja svæðið fyrir textaþekkingu á skráarsíðunni handvirkt.

Online þjónusta NewOCR

  1. Þannig getur þú byrjað að vinna með auðlindina án þess að þurfa að framkvæma óþarfa aðgerðir.

    Beint á forsíðu er form til að flytja skjalið inn á síðuna. Til að hlaða inn skrá í NewOCR skaltu nota hnappinn "Veldu skrá" í kaflanum "Veldu skrána". Þá á vellinum "Viðurkenningar tungumál (ir)" veldu eitt eða fleiri tungumál upphafsskjalsins og smelltu síðan á "Hladdu upp + OCR".
  2. Stilltu valinn viðurkenningarstilling, veldu viðkomandi síðu til að draga textann út og smelltu á hnappinn. "OCR".
  3. Skrunaðu aðeins niður og finndu hnappinn. Sækja.

    Smelltu á það og í fellilistanum skaltu velja nauðsynlegt skjalasnið til að hlaða niður. Eftir það verður lokið skrá með útdregnum texta hlaðið niður í tölvuna þína.

Verkfæri er þægilegt og viðurkennir alla stafi í nægilega háum gæðum. Hins vegar verður vinnsla á hverri síðu af innfluttu PDF skjalinu sjálfstætt og birt í sérstakri skrá. Þú getur auðvitað afritað viðurkenningarniðurstöðurnar strax til klemmuspjaldsins og sameinað þeim við aðra.

Engu að síður, miðað við ofangreindan lit, eru mikið magn af texta sem notar NewOCR mjög erfitt að vinna úr. Með sömu litlu skrár þjónustunnar lýkur "með bang".

Aðferð 4: OCR.Space

Einföld og skiljanlegt úrræði til að stafræna texta gerir þér kleift að þekkja PDF skjöl og framleiða útkomuna í TXT skrá. Það eru engin takmörk á fjölda síðna. Eina takmörkunin er sú að stærð inntakslýsingarinnar ætti ekki að fara yfir 5 megabæti.

OCR.Space vefþjónustu

  1. Skráðu þig til að vinna með tækið er ekki nauðsynlegt.

    Smelltu bara á tengilinn hér að ofan og sendu PDF skjalið á vefsíðuna úr tölvunni þinni með því að nota hnappinn "Veldu skrá" eða frá netinu - með tilvísun.
  2. Í fellilistanum "Veldu OCR tungumál" veldu tungumál innfluttra skjala.

    Þá byrjaðu textakennsluferlið með því að smella á hnappinn. "Start OCR!".
  3. Í lok skráarvinnslu, sjáðu niðurstöðurnar í "OCR'ed Result" og smelltu á Sækjatil að hlaða niður lokið TXT skjalinu.

Ef þú þarft bara að þykkni textann úr PDF og endanlegt snið er ekki mikilvægt, þá er OCR.Space gott val. Eina skjalið verður að vera "eingöngu", þar sem viðurkenning tveggja eða fleiri tungumála á sama tíma í þjónustunni er ekki veitt.

Sjá einnig: Free hliðstæður FineReader

Mat á netverkfærunum sem kynntar eru í greininni ber að hafa í huga að FineReader Online frá ABBYY annast OCR virknina nákvæmlega og nákvæmlega. Ef hámarks nákvæmni textaritunar er mikilvæg fyrir þig er best að sérstaklega íhuga þennan valkost. En að borga fyrir það, líklega, líka að.

Ef þú þarft að stafræna lítil skjöl og þú ert tilbúin til að leiðrétta villur við þjónustuna sjálfur, er ráðlegt að nota NewOCR, OCR.Space eða Free Online OCR.