AWS re:Invent 2018

Amazon lanceert Textract

Afgelopen maand lanceerde Amazon Web Services (AWS) Amazon Textract. Deze machine learning ontwikkeling is echt een revolutie in OCR-land, waardoor OCR-bedrijven (zoals bijv. Kofax) gaan verdwijnen door nieuwe technologieën.

Een uitdaging voor veel bedrijven is het omzetten van de formulieren naar een bruikbaar digitaal formaat. Denk aan ziekenhuizen, maar ook financiele overzichten. Tot nu toe werd daarvoor OCR (optimal character recognition) gebruikt om formulieren automatisch te lezen, echter dit is alleen maar een basale tekstlezer. Hij herkent geen text types. AWS wilde dit veranderen en bedacht Textract, een intelligente OCR-tool die data van formulieren omzet in een bruikbaar digitaal formaat.

Met behulp van Amazon Textract kunnen bedrijven miljoenen documenten verwerken in een paar uur tijd, zonder dat hiervoor handmatige review van de documenten nodig is.

Aan de hand van een voorbeeld laat AWS zien dat Textract niet alleen tekst maar ook tabellen herkent en deze data omzet in een bruikbaar formaat, daar waar de OCR het geheel van de tekst achter elkaar zet. Daarnaast veranderen formulieren door de tijd heen, waarbij de intelligentie van Amazon Textract ervoor zorgt dat gebruikelijke dat typen, zoals bijv. het Digid-nummer herkend blijft.
Daar waar we zien dat veel bedrijven willen groeien door overnames, doet AWS het door machine learning. Wij verwachten dat deze ontwikkeling een aanzienlijke impact heeft op de OCR-bedrijven, hoe lang blijven deze nog bestaan?

Introductie Amazon Textract tijdens AWS re:Invent 2018

Scroll naar boven