OCR
Står för "Optisk karaktärsigenkänning." OCR är en teknik som känner igen text i en digital bild. Det används ofta för att känna igen text i skannad dokument, men det tjänar också många andra syften.
OCR-programvara bearbetar en digital bild genom att lokalisera och känna igen tecken, såsom bokstäver, siffror och symboler. En del OCR-program exporterar helt enkelt texten, medan andra program kan konvertera tecknen till redigerbar text direkt i bilden. Avancerad OCR-programvara kan exportera storleken och formateringen av texten samt layouten för texten som finns på en sida.
OCR-teknik kan användas för att konvertera en papperskopia av ett dokument till en elektronisk version (eller mjuk kopia. Till exempel om du skannar ett flersidigt dokument till en digital bild, till exempel en TIFF kan du ladda dokumentet i ett OCR-program, som känner igen texten och konverterar dokumentet till en redigerbar textfil. I vissa OCR-program kan du skanna ett dokument och konvertera det till en ordbehandling dokument i ett enda steg.
Medan OCR-tekniken ursprungligen utformades för att känna igen tryckt text kan den också användas för att känna igen och verifiera handskriven text. Till exempel använder posttjänster som USPS OCR-programvara för att automatiskt behandla brev och paket baserat på adressen. De algoritm kontrollerar den skannade informationen mot databasen över befintliga adresser för att bekräfta postadressen. Google Översätt app innehåller OCR-teknik som fungerar med enhetens kamera. Det låter dig fånga texten från dokument, tidskrifter, skyltar och andra objekt och översätta den till ett annat språk på realtid.