Kako prevesti papirni dokument brez neskončnega prepisovanj
Papirnati dokument postane težava šele takrat, ko je treba z njim delati
Papir deluje odlično, dokler ostaja papir. Težava nastopi, ko je dokument treba spremeniti, arhivirati, poslati v tujino ali prevesti v drug jezik. Takrat se iz preprostega obrazca ali pogodbe postane nepraktična stvar, ki jo večina ljudi še vedno rešuje z ročnim prepisovanjem. Pri eni strani gre še nekako. Pri večstranskih dokumentih pa ne več. Toliko bolj presenetljivo je dejstvo, da tehnologije za reševanje tega problema obstajajo že leta le da so postale dovolj uporabne za vsakdanje uporabnike šele razmeroma nedavno.
Danes namreč ne gre le za klasična orodja OCR. V proces je močno vstopila umetna inteligenca, ki zna ne le prepoznati besedilo iz skeniranega dokumenta, temveč pogosto tudi popraviti napake, preoblikovati besedilo ali pripraviti prevod v sprejemljivi kakovosti.
Največja težava se pojavi kar na začetku
Mnogi pričakujejo, da bo OCR ali AI „nekako zmogel" tudi slabovredni vhod. A prav tu proces najpogosteje odpove. Dokument, ki je bil fotografiran poševno pod namizno lučjo s senco čez pol besedila, sodobni sistemi sicer obdelajo, a rezultat je daleč od brezhibnega. OCR namreč ne razume besedila kot človek. Išče slikovne vzorce. Če so črke zamegljene, prekrite z žigom ali izkrivljene s perspektivo, sistem začne ugibati. Ugibanje pri dokumentih pa ni idealno.
Paradoksalno zato pogosto ne odloča kakovost AI-orodja, temveč preprosta kakovost fotografije. Dobra svetloba in kontrast imata večjo praktično vrednost kot marketinške fraze o „inteligentnem prepoznavanju dokumentov".
Pametni telefon danes pogosto zadostuje namesto optičnega bralnika
Hkrati že zdavnaj ne drži več, da je za kakovosten rezultat potreben velik pisarniški skener. Sodoben pametni telefon z aplikacijo, kot je Microsoft Lens ali Adobe Scan, v nekaj sekundah ustvari zelo uporaben sken.
Te aplikacije samodejno poravnajo perspektivo, obrežejo robove dokumenta in povečajo kontrast besedila. Rezultat je pogosto boljši kot pri poceni domačem optičnem bralniku izpred nekaj let.
V praksi to pomeni, da se je celoten postopek bistveno pospešil. Dokumenta ni treba fizično skenirati v računalnik. Dovolj ga je fotografirati in takoj poslati v orodje OCR ali AI.

vir: canva
OCR je še vedno temelj, brez katerega AI ne deluje dobro
Čeprav se danes veliko govori o AI, temelj celotnega postopka ostaja enak — pridobiti je treba čisto, urejljivo besedilo. In prav tu nastopi OCR.
Brezplačne spletne storitve OCR danes pri navadnem tiskanem besedilu delujejo presenetljivo dobro. Slabše je z obrazci, tabelami ali dokumenti z žigi in podpisi. Oglasi orodij OCR pogosto prikazujejo popolnoma čiste dokumente, resničnost pa je precej bolj kaotična.
En žig čez odstavek in polovica besedila postane neuporabna. Enako problematične so ročno dopisane opombe ali starejši dokumenti s slabo kakovostjo tiska.
Prav tu ostaja vidna razlika med preprostimi spletnimi storitvami in profesionalnimi orodji, kot sta ABBYY FineReader ali Adobe Acrobat. Ta sicer stanejo denar, a pri zahtevnejših dokumentih znajo bistveno bolje ohraniti strukturo strani, tabele in oblikovanje.
Oblikovanje je namreč v praksi pogosto večji problem kot besedilo samo. OCR sicer prepozna besede, a porušena struktura dokumenta vzame več časa kot sam prevod.
Umetna inteligenca danes bolj pomaga po OCR kot med njim
Najpomembnejša sprememba zadnjih let je, da AI danes pogosto ni najboljša pri prepoznavanju besedila, temveč pri popravljanju tega, kar OCR pokvari.
Ko OCR ustvari besedilo z okrnjeno diakritiko, manjkajočimi besedami ali poškodovanimi stavki, sodobni AI-modeli te napake znajo dokaj dobro rekonstruirati. Razumejo kontekst stavka in ocenijo, kaj v besedilu verjetno manjka.
To je bistvena razlika v primerjavi s starejšimi prevajalniki, ki so delovali pretežno stavek za stavkom. Sodobni AI-sistemi delajo z večjim kontekstom dokumenta, zato rezultat deluje bolj naravno in manj strojno.
V praksi to pomeni, da uporabnik danes OCR-besedilo vstavi v AI-orodje in zahteva, na primer, popravek napak, ohranitev formalnega sloga ali prevod v tehnični jezik. Pri kakovostnem vhodu to deluje presenetljivo dobro.
AI danes zmore tudi dokument, fotografiran z mobilnikom
Novejši AI-sistemi pogosto ne potrebujejo več ločenega koraka OCR. Uporabnik preprosto naloži fotografijo dokumenta in AI sama prepozna besedilo, ga prevede ali pripravi povzetek.
Pri preprostih dokumentih je to zelo priročna rešitev. Težava se pojavi pri zahtevnejših formatih. Tabele, večstolpčne postavitve ali tehnični dokumenti sodobnim AI-modelom še vedno povzročajo preglavice.
Marketing okoli AI pogosto ustvarja vtis, da gre za univerzalno rešitev. Resničnost je zaenkrat precej manj elegantna. Bolj ko je dokument zahteven, več ročnega preverjanja je še vedno potrebnega.
Sam prevod je danes paradoksno najlažji del
Ko obstaja kakovostno, urejljivo besedilo, je sam prevod navadno najlažji del celotnega postopka. Microsoft Word danes zna v celoti prevesti dokument neposredno v Wordu s pomočjo Microsoft Translator, brez kopiranja besedila med aplikacijami.
Alternativa so storitve, kot sta DeepL ali Google Translate. DeepL deluje bolj naravno zlasti pri evropskih jezikih, Google Translate je splošnejši, a pri zahtevnejših formulacijah bolj mehanski.
Prava težava pa ni v tem, ali besedilo zveni naravno. Pomembno je, ali je pomensko natančno.
Največje tveganje AI so napake, ki izgledajo pravilno
OCR navadno dela vidne napake. Zlomljeno besedo ali nelogičen znak človek opazi razmeroma hitro. AI dela nevarnejšo vrsto napak ustvarja stavke, ki zvenijo povsem naravno, a so pomensko lahko napačni.
Pri navadnem članku to večinoma ne šteje. Pri pravnih dokumentih, tehničnih besedilih ali pogodbah pa. Ena netočna formulacija lahko spremeni pomen celotnega stavka, ne da bi jo uporabnik opazil.
Zato poklicni prevajalci kljub vzponu AI niso izginili. Sodobna orodja delo bistveno pospešijo, a absolutne natančnosti še ne zagotavljajo.
Udobje se pogosto zalomi ob vprašanju zasebnosti
Manj se govori o tem, da velik del spletnih storitev OCR in AI deluje tako, da uporabnik naloži dokument na tuj strežnik. Pri navadnem besedilu večina tega ne problematizira. Pri rojstnih listih, poslovnih dokumentih ali zdravstvenih izvidih gre za bistveno občutljivejše vprašanje.
Ni vedno jasno, kako dolgo se dokument hrani ali ali se ne uporablja za nadaljnje urjenje sistemov. Pri občutljivih podatkih je zato bolj smiselna lokalna programska oprema ali korporativne rešitve z jasnimi pravili o ravnanju s podatki.
AI danes prihrani predvsem čas, ne potrebe po kontroli
Največji praktični napredek zadnjih let ni v tem, da je AI v celoti nadomestila človeka. Pomembno je bolj to, da je dramatično pospešila celoten postopek.
Dokument, ki je nekoč pomenil uro monotonega prepisovanja, je danes mogoče pripraviti in prevesti v nekaj minutah. Hkrati pa velja, da bolj ko je dokument zahteven, bolj se iz avtomatizacije razvije polsamodejno uredniško delo.
Najboljši rezultat nastane danes še vedno s kombinacijo kakovostnega OCR, razumne uporabe AI in preprostega človeškega nadzora.