Pag-ila sa teksto sa usa ka PDF file sa online

Pin
Send
Share
Send


Halayo kini sa kanunay nga mahimo aron makuha ang teksto gikan sa usa ka PDF file gamit ang regular nga pagkopya. Kasagaran ang mga panid sa ingon nga mga dokumento gi-scan ang mga sulud sa ilang mga bersyon sa papel. Aron mabalhin ang ingon nga mga file aron mahimo nga bug-os nga na-edit nga datos sa teksto, gigamit ang mga espesyal nga programa nga adunay function nga Optical Character Recognition (OCR).

Ang maong mga desisyon lisud kaayo nga ipatuman ug, busa, daghang kantidad nga salapi. Kung kinahanglan nimo nga mailhan kanunay ang teksto gikan sa PDF, maayo nga ipalit ang angay nga programa. Alang sa mga talagsa nga mga kaso, labi nga makatarunganon nga gamiton ang usa sa mga magamit nga serbisyo sa online nga adunay parehas nga mga gimbuhaton.

Giunsa ang pag-ila sa teksto gikan sa PDF online

Siyempre, ang han-ay sa mga bahin sa serbisyo sa online nga OCR, kung itandi sa hingpit nga mga solusyon sa desktop, labi pa nga limitado. Apan mahimo ka usab magtrabaho sa ingon nga mga kapanguhaan bisan sa libre o alang sa usa ka nominal nga bayad. Ang nag-unang butang mao nga sa ilang nag-unang buluhaton, nga mao ang pag-ila sa teksto, ang mga katugbang nga aplikasyon sa web makasagubang usab.

Paagi 1: ABBYY FineReader Online

Ang kompanya sa pagpauswag sa serbisyo usa ka pinuno sa natad sa pag-ila sa optical nga dokumento. Ang ABBYY FineReader alang sa Windows ug Mac usa ka gamhanan nga solusyon alang sa pagbalhin sa PDF ngadto sa teksto ug dugang nga pagtrabaho uban niini.

Ang analogue nga nakabase sa web sa programa, siyempre, labing ubos niini sa pagpaandar. Bisan pa, ang serbisyo makaila sa teksto gikan sa mga pag-scan ug mga litrato sa labaw pa sa 190 nga mga pinulongan. Pag-convert sa mga file sa PDF sa Word, Excel, ug uban pa nga gisuportahan ang mga dokumento.

ABBYY FineReader Online Online nga Pag-alagad

  1. Sa wala ka pa magsugod sa pagtrabaho sa gamit, paghimo usa ka account sa site o pag-log in gamit ang imong Facebook, Google o Microsoft account.

    Aron makaadto sa bintana sa pagtugot, pag-klik sa buton "Pagsulod" sa top menu bar.
  2. Pagkahuman sa pag-log in, i-import ang gusto nga PDF-dokumento sa FineReader gamit ang buton "Pag-upload sa mga file".

    Unya pag-klik "Pilia ang mga numero sa panid" ug ipiho ang gitinguha nga agwat alang sa pagkilala sa teksto.
  3. Sunod, pilia ang mga sinultian nga naa sa dokumento, ang pormat sa sangputanan nga file, ug i-klik ang buton "Ilha".
  4. Pagkahuman sa pagproseso, ang gidugayon nga nagsalig sa tibuuk nga kantidad sa dokumento, mahimo nimo i-download ang nahuman nga file nga adunay datos sa teksto pinaagi sa pag-klik sa ngalan niini.

    O, i-export kini sa usa sa magamit nga serbisyo sa panganod.

Ang serbisyo tingali mailhan pinaagi sa labing tukma nga algorithm sa pagkilala sa teksto sa mga imahe ug mga file sa PDF. Apan, makapasubo, ang libre nga paggamit niini limitado sa lima nga panid nga giproseso matag bulan. Aron magtrabaho uban ang mas daghang mga dokumento, kinahanglan nga mopalit ka us aka tinuig nga suskrisyon.

Bisan pa, kung ang OCR panagsa ra nga gikinahanglan, ang ABBYY FineReader Online usa ka maayo nga kapilian alang sa pagkuha sa teksto gikan sa gagmay nga mga file sa PDF.

Paagi 2: Libre nga Online OCR

Yano ug sayon ​​nga serbisyo alang sa pag-digit sa teksto. Kung wala’y pagrehistro, gitugotan ka sa kapanguhaan nga maila ang 15 nga tibuuk nga panid sa PDF matag oras. Ang Libre nga Online OCR hingpit nga nagtrabaho uban ang mga dokumento sa 46 nga mga pinulongan ug kung wala ang pagtugot nagsuporta sa tulo nga mga format sa pag-export sa teksto - DOCX, XLSX ug TXT.

Kung nagparehistro, ang gumagamit nakakuha kahigayonan sa pagproseso sa mga dokumento sa daghang panid, apan ang libre nga gidaghanon sa parehas nga panid limitado sa 50 nga yunit.

Libre nga Serbisyo Online nga OCR Online

  1. Aron mailhan ang teksto gikan sa PDF ingon usa ka "bisita", nga walay pagtugot sa kapanguhaan, gamita ang angay nga porma sa panguna nga panid sa site.

    Pilia ang gitinguha nga dokumento gamit ang buton Pag-file, ipiho ang nag-unang sinultihan sa teksto, ang format sa output, unya maghulat alang sa file nga ma-load ug i-klik Pag-usab.
  2. Sa katapusan sa proseso sa pag-digit, pag-klik "Pag-download sa output file" aron maluwas ang nahuman nga dokumento gamit ang teksto sa kompyuter.

Alang sa mga awtorisado nga tiggamit, ang pagkasunod-sunod sa mga aksyon medyo lahi.

  1. Gamita ang buton "Pagparehistro" o "Pagsulod" sa top menu bar sa, sumala niana, paghimo usa ka Free Online OCR account o pag-log in.
  2. Pagkahuman sa pagtugot sa panel sa pag-ila, ihunong ang yawi CTRL, pagpili hangtod sa duha ka mga pinulongan sa gigikanan nga dokumento gikan sa lista nga gihatag.
  3. Tinoa ang dugang nga kapilian alang sa pagkuha sa teksto gikan sa PDF ug i-klik Pagpili file pag-upload sa usa ka dokumento sa serbisyo.

    Pagkahuman, aron masugdan ang pag-ila, i-klik Pag-usab.
  4. Sa katapusan sa pagproseso sa dokumento, pag-klik sa link nga adunay ngalan sa output file sa katugbang nga kolum.

    Ang resulta sa pagkilala maluwas dayon sa panumduman sa imong computer.

Kung kinahanglan nimo nga makuha ang teksto gikan sa gamay nga dokumento nga PDF, mahimo nimo luwas nga gamiton ang gamit sa ibabaw. Aron magtrabaho uban ang daghang mga file, kinahanglan ka mopalit dugang nga mga karakter sa Free Online OCR o mogamit us aka solusyon.

Paagi 3: NewOCR

Hingpit nga libre nga OCR-service nga nagtugot kanimo sa pagkuha sa teksto gikan sa hapit bisan unsang mga graphic ug electronic nga dokumento sama sa DjVu ug PDF. Ang kapanguhaan dili magpahamtang mga pagdili sa gidak-on ug gidaghanon sa giila nga mga file, wala magkinahanglan og pagrehistro ug nagtanyag usa ka halapad nga kalabotan sa mga may kalabutan nga function.

Gisuportahan sa NewOCR ang 106 nga mga pinulongan ug mahimo’g maproseso bisan ang mga kalidad nga scan sa dokumento. Posible nga manwal nga pilion ang lugar alang sa pag-ila sa teksto sa panid sa file.

Bag-ong Serbisyo sa OnlineOCR

  1. Busa, mahimo ka magsugod sa pagtrabaho sa usa ka kapanguhaan dayon, nga wala kinahanglan nga buhaton ang dili kinahanglan nga mga aksyon.

    Sa tuo sa panguna nga panid adunay porma alang sa pag-import sa usa ka dokumento sa site. Aron ma-upload ang usa ka file sa NewOCR, gamita ang buton "Pilia ang file" sa seksyon "Pilia ang imong file". Nian sa bukid "Mga (lahi) nga pinulongan Pagtudlo sa usa o daghan pa nga mga sinultihan sa gigikanan nga dokumento, dayon i-klik "Upload + OCR".
  2. Ibutang ang imong gusto nga mga setting sa pagkilala, pilia ang panid nga gusto nimo makuha ang teksto gikan ug i-klik ang buton OCR.
  3. Pag-scroll sa panid og gamay ug pangitaa ang buton "Pag-download".

    Pag-klik niini ug sa lista sa drop-down pilia ang kinahanglan nga format sa dokumento alang sa pag-download. Pagkahuman niana, ang nahuman nga file gamit ang nakuha nga teksto ma-download sa imong computer.

Ang himan dali ug labi ka taas nga kalidad nga nakilala ang tanan nga mga karakter. Bisan pa, ang pagproseso sa matag panid sa gi-import nga dokumento sa PDF kinahanglan magsugod nga independente ug kini gipakita sa usa ka gilain nga file. Mahimo nimo, siyempre, kopyahon dayon ang mga resulta sa pagkilala sa clipboard ug isagol kini sa uban.

Bisan pa, kung gihisgutan sa ibabaw, lisud kaayo nga makuha ang daghang mga teksto nga gigamit ang NewOCR. Uban sa gagmay nga mga file, ang serbisyo nagsagup sa usa ka bang.

Paagi 4: OCR.Space

Usa ka yano ug masabtan nga kapanguhaan alang sa pag-digit sa teksto, kini nagtugot kanimo nga mailhan ang mga dokumento sa PDF ug i-output ang sangputanan sa usa ka file nga TXT. Wala’y mga limitasyon sa gidaghanon sa mga panid nga gihatag. Ang bugtong limitasyon mao ang kadako sa dokumento sa pag-input dili kinahanglan molapas sa 5 megabytes.

Ang serbisyo sa OCR.Space Online

  1. Pagrehistro aron magtrabaho uban ang himan dili kinahanglan.

    Pagsunod lang sa link sa taas ug pag-upload sa dokumento sa PDF sa website gikan sa computer gamit ang buton "Pilia ang file" o gikan sa network - pinaagi sa pakisayran.
  2. Sa gihulog nga lista "Pilia ang sinultian nga OCR" Pilia ang pinulongan sa gi-import nga dokumento.

    Unya pagsugod sa proseso sa pag-ila sa teksto pinaagi sa pag-klik sa buton "Sugdi ang OCR!".
  3. Sa katapusan sa pagproseso sa file, basaha ang resulta sa uma Ang Resulta sa OCR ug i-klik "Pag-download"aron ma-download ang nahuman nga dokumento sa TXT.

Kung kinahanglan nimo nga makuha ang teksto gikan sa PDF ug sa samang higayon ang katapusan nga pag-format niini dili hinungdan sa tanan, ang OCR.Space usa ka maayong kapilian. Ang bugtong butang mao nga ang dokumento kinahanglan nga "monolingual", tungod kay ang pag-ila sa duha o daghan pa nga mga pinulongan sa parehas nga oras wala gihatag alang sa serbisyo.

Tan-awa usab: Libre nga mga analogue sa FineReader

Gipasalig ang mga gamit sa online nga gipresentar sa artikulo, kinahanglan nga hinumdomi nga ang FineReader Online gikan sa ABBYY ang nagdumala sa OCR function nga labing tukma ug hapsay. Kung ang labing kadako nga katukma sa pag-ila sa teksto hinungdanon alang kanimo, mas maayo nga ikonsiderar kini nga kapilian nga piho. Apan lagmit, kinahanglan ka usab magbayad alang niini.

Kung kinahanglan nimo nga ma-digitize ang gagmay nga mga dokumento ug andam ka nga mag-independente sa pagtul-id sa mga sayup sa serbisyo, gisugyot nga gamiton ang NewOCR, OCR.Space o Free Online OCR.

Pin
Send
Share
Send