Hvordan fungerer OCR? Forklaret på en enkel og forståelig måde
I denne artikel forklarer vi, hvordan OCR fungerer. OCR står for "Optical Character Recognition" og omtales ganske enkelt på tysk som tekstgenkendelse. Dette betyder, at en computer kan genkende tekst på et scannet billede ved hjælp af OCR og derefter konvertere den til et simpelt tekstdokument.
Sådan fungerer OCR
Forestil dig, at du modtog en papirpræsentation fra en kollega. Du vil nu redigere disse på pc'en, fordi du ikke kan lide individuelle passager. Så scann det og gå til dit OCR-program. Nu sker følgende:
- Softwaren foretager først en såkaldt layoutanalyse. For at gøre dette ser hun på sidelayoutet og adskiller billeder fra tekst. Hun bemærker også deres position på siden. Derefter tælles antallet af afsnit, og individuelle elementer, f.eks. Sidetal, gemmes.
- Nu kommer den hårde del. Softwaren ser på de enkelte tekstblokke og opdeler dem i sætninger. Sætningerne opdeles derefter i individuelle ord og ordene i bogstaver.
- OCR-softwaren indeholder mønstre med bogstaver og tegn. Programmet sammenligner nu de scannede bogstaver med disse mønstre. Hvis de er 99% ens, bestemmer algoritmen, at det sandsynligvis skal være det bogstav. Det er meget præcist, fordi det kan sammenligne mange mønstre på kort tid. På denne måde skelner han med succes mellem en "8" og en "B".
- Så bogstaver og tegn genkendes gradvist. Derefter kombineres de igen som ord og sættes tilbage på deres plads i sætningen. Så snart softwaren er færdig, gemmes det hele i et normalt dokument, som du derefter kan redigere. Udført!
Vil du teste din softwarekendskab? Deltag i vores store softwareprøve!