Sistema de digitalización de texto manuscrito implementando Google Vision API

Autores/as

  • Gabriela Itzell Rangel Velázquez

Palabras clave:

Android, Google Vision API, reconocimiento óptico de caracteres, texto manuscrito

Resumen

El procesamiento de imágenes, en conjunto con el
reconocimiento de patrones, han sido áreas de estudio
explotadas en los últimos años, logrando avances como la
clasificación de objetos, el reconocimiento de rostros y el
reconocimiento de texto. En particular, este último permite
que textos escritos a mano, máquina o impresos, se
conviertan en textos digitales editables. En este trabajo se
describe el diseño y funcionamiento de un sistema de
digitalización de texto manuscrito, mediante la
implementación de la Google Vision API, orientado para
dispositivos Android. El objetivo de la investigación es
verificar si su uso aumenta la eficiencia al reconocer texto
autógrafo debido al bajo rendimiento que presentan los
sistemas de Reconocimiento Óptico de Caracteres (OCR) al
procesar textos de este tipo. El sistema desarrollado consta
de tres módulos: 1) Adquisición de la imagen, 2) Solicitud de
consumo de la API y 3) Digitalización del OCR generado.
Para la evaluación de su desempeño, se utilizaron once
formatos de documentos correspondientes al área de
educación, salud e industria, y cuatro diferentes condiciones
de imagen (respecto al ajuste de calidad y recorte de área de
interés), así como una comparativa con algunas de las
aplicaciones existentes en el mercado. A partir de lo anterior,
se calculó el reconocimiento promedio de las palabras
manuscritas con respecto a las contenidas en cada formato
empleado y se determinó un 67% de eficiencia del sistema.

Publicado

2021-05-13

Número

Sección

Conference on Computer Science and Computer Engineering