25.11.2012 09:24
Posodobljeno 11 let nazaj.

Deli z drugimi:

Share

4 brezplačna orodja za optično prepoznavanje znakov – OCR

Verjeli ali ne, nekateri ljudje še vedno dokumente tiskajo na fizični kos papirja. Prav zaradi tega smo se potrudili in na enem mestu zbrali nekatera najboljša brezplačna OCR orodja.
OnlineOCR je prav gotovo najboljše brezplačno orodje za prepoznavanje znakov.
OnlineOCR je prav gotovo najboljše brezplačno orodje za prepoznavanje znakov.

Programska oprema za optično prepoznavanje znakov (angl. Optical Character Recognition – OCR) pretvarja papirne dokumente in datoteke PDF v elektronsko obliko. Programe OCR uporabljamo v povezavi z računalnikom in optičnim bralnikom (skenerjem). S slednjim skopiramo natisnjeno besedilo na računalnik, kjer ga lahko v elektronski obliki shranimo ali denimo preberemo in povečamo z ustrezno programsko opremo. Slepi in slabovidni lahko s pomočjo naprednejših programov OCR berejo tiskane vsebine, na primer knjige, revije, dopise in druge tiskovine. Programi OCR lahko rešujejo tudi težave pri učenju, denimo v primerih, ko učeči težko berejo ali pa ko imajo zaradi gibalnih in fizičnih prizadetosti omejene možnosti rokovanja s tiskanim materialom.

Kako deluje OCR?

Knjigo ali drugo tiskovino vložimo v optični bralnik, povezan z računalnikom. Bralnik posname sliko dokumenta in jo v elektronski obliki posreduje računalniku. Program OCR nato pretvori informacije s slike v besedilo, to pa lahko nato prebere bralnik besedila, ki prav tako teče na računalniku. Programi OCR praviloma ne zmorejo brati rokopisa. Optično prepoznavanje znakov se je sprva uporabljalo na področju umetne inteligence in pri raziskovanju strojnega vida. Nobeno OCR orodje seveda ni popolno, zato boste morali po pretvorbi slike v besedilo določene napake popraviti ročno. Vsekakor je uporaba OCR orodja veliko hitrejša metoda kot ročno prepisovanje celotnega besedila. Vsako od naslednjih brezplačnih OCR orodji ima svoje prednosti in slabosti, rezultat vseh pa bo na koncu precej podoben.

Google Drive (goo.gl/7ESpw)

Storitev Google Drive uporabnikom nudi tudi podporo za prepoznavanje znakov. Uporablja povsem identično OCR orodje, ki ga Google koristi za pretvorbo knjig v PDF datoteke. Za začetek boste morali obiskati vstopno stran Google Driva in prenesti želene datoteke. Poskenirane dokumente lahko na Google Drive naložite v oblike slikovnega formata ali v PDF datoteki. Najprej kliknite na ikono za prenos datotek. Ko bo dokument prenesen, kliknite na nastavitve in izberite opcijo Pretvori tekst iz prenesenih PDF in slikovnih datotek. Vaš dokument boste lahko nato shranili na disk in ga urejali v izbranem urejevalniku besedil.

FreeOCR (goo.gl/oFkZk)

Free OCR je brezplačna spletna OCR storitev, ki pretvori katero koli slikovno datoteko v besedilno datoteko, ki jo lahko urejate v Wordu ali kakšnem drugem urejevalniku besedil. Ta za svoje delovanje koristi kodo Tesseract, ki je bila razvita v HP-jevih laboratorijih med letoma 1985 in 1995. Spletno mesto podpira BMP, GIF, JPEG, TIFF in PDF datoteke. Čeprav bo trenutno moč pretvoriti le prvo stran PDF dokumenta, ustvarjalci obljubljajo, da bo omejitev odpravljena že v bližnji prihodnosti. Največja velikost datoteke, ki jo je moč pretvoriti, znaša 2 MB, s priporočeno resolucijo najmanj 150 dpi. Prav tako se boste za zdaj morali odreči močno razdelanim dokumentom: Prosti OCR še ne podpira stolpcev in podobnih zadev. Kakovost pretvorbe bo tako na prvem mestu odvisna od narave in ločljivosti slike. Kljub temu naj bi storitev opravila dokaj impresivno delo. Orodje se je na našem testu izkazalo za precej dobro. Poleg tega ima zelo enostaven grafični vmesnik, ki uporabniku pretvorbo omogoča že v nekaj preprostih korakih.

OnlineOCR (goo.gl/wXeWv)

Je odlično spletno orodje, ki bo prepoznalo tekst in simbole iz PDF ali slikovne datoteke ter jih pretvorilo v različne digitalne formate, vključno z Wordom in s PDF-jem. Pri tem bodo nedotaknjene ostale tudi različne forme, kot so tabele, grafične oznake, slike in podobno. Najbolj pomembno pri tem je, da boste lahko za ciljni jezik lahko izbrali tudi slovenščino. OnlineOCR je povsem brezplačno orodje, edina omejitev pri tem je le, da boste lahko na uro pretvorili le 15 dokumentov. Najprej boste morali izbrati datoteko na vašem računalniku, in sicer to storite s klikom na gumb Choose File. Zatem kliknite na gumb Upload, določite vrsto jezika (Recognition language) in izhodnega formata (Output format) in kliknite za začetek prepoznavanja znakov (Recognize). Ko bo postopek zaključen, se bo v besedilnem polju pojavil tekst iz dokumenta, ki ga lahko nato tudi v želenem formatu prenesete na vaš trdi disk.

NewOCR (goo.gl/Hr9MT)

NewOCR je brezplačno orodje za prepoznavanje znakov, ki za svoje delovanje koristi programsko kodo Tesseract. Orodje je povsem brezplačno, potrebna ni nikakršna registracija, prav tako pa je na voljo prepoznavanje slovenskega jezika. Tudi s tem orodjem boste sliko oziroma dokument brez težav pretvorili v tekst, žal pa se boste ob tem morali sprijazniti z dejstvom, da orodje ne ohranja prvotne oblike dokumenta. Ko boste na vstopni strani omenjenega orodja, kliknite na gumb Choose File in izberite jezik, v katerem želite pretvorbo dokumenta. Zatem kliknite na modri gumb Preview in počakajte, da se dokument naloži. Ko bo program prepoznal dokument, izberite del, ki ga želite spremeniti v znake, in za začetek pretvorbe kliknite na gumb OCR.

In zmagovalec je?

  1. OnlineOCR
  2. NewOCR
  3. FreeOCR
  4. Google Drive

Po našem mnenju je pri pretvorbi slike v tekst najboljše delo, kljub omejitvi 15 pretvorb na uro, opravilo orodje OnlineOCR. Poleg zgoraj naštetih OCR orodij smo preizkusili še programa OpenOCR in SimpleOCR, ki pa žal ne podpirata slovenskega jezika.


Prijavi napako v članku

Povezave



Kaj berejo drugi?

Partnerji Računalniških novic Prikaži vse

Srebrni partner

LESTRA d.o.o.

Vaška pot 17c, 1235 Radomlje, Tel: 01 563 60 60
Vodilni na področju trženja projektorjev – strokovno svetovanje, izposoja, montaža in servis Z več kot 30-letnimi izkušnjami in najboljšo izbiro projekcijske opreme za vas. V ... Več

OBLIKOVANJE.COM

Slovenska ulica 25, 9000 Murska Sobota, Tel: 02 522 14 21
Podjetje Oblikovanje.com je v slovenskem računalniškem prostoru prisotno že od samega začetka. Z več kot 20 leti izkušenj ter s strategijo kakovostnega poslovanja in storitev ... Več

MIT INFORMATIKA d.o.o.

Sveti Duh 274, 4220 Škofja loka, Tel: 04 281 31 00
Celovite ERP rešitve za podjetja MIT informatika je vodilni partner proizvodnih, gradbenih in storitvenih podjetij. Že 30 let svetujejo in implementirajo inovativne informacijske ... Več

CICERO, BEGUNJE, d.o.o.

Stegne 21c, 1000 Ljubljana, Tel: 01 507 42 92, 041 662 178