Análisis de motores de conversión de voz a texto para desarrollo de software multiplataforma.

Autores/as

  • Fernando Mercado Salinas

Palabras clave:

Análisis de exactitud, Comandos de Voz, Motor de conversión de voz a texto

Resumen

En este trabajo se presenta una contribución al estudio del
área de procesamiento de lenguaje natural (PLN), mediante
el análisis de diferentes motores de conversión de voz a texto
empleados en el desarrollo de aplicaciones de software
multiplataforma que implementan comandos de voz como
interfaz para el ingreso de información. Para ello se
contempla una revisión entre los motores más utilizados, la
rápida implementación de estos, el nivel al que trabajan ya
sea local o mediante servicios online, asimismo se verifica si
son de acceso libre o requieren algún tipo de licenciamiento
y principalmente la exactitud para desempeñar el trabajo de
conversión. Se genera una arquitectura en la cual se reciben
como entradas, archivos de audio que contiene la grabación
de frases en español, mismas que han sido enunciadas por
voces masculinas y femeninas y también por voces
sintetizadas mediante computadora para poner a prueba el
funcionamiento de los motores.
Las pruebas de esta arquitectura se implementan mediante la
codificación de algoritmos en lenguaje de programación
Python y los resultados generados se estructuran por el
número de palabras detectadas, coincidencia del total de
palabras, coincidencia de la frase y coincidencia de palabras
respecto a la frase original, estos permiten aplicar una
métrica para analizar el rendimiento de los motores y poder
establecer conclusiones y trabajo a futuro. Análisis

Publicado

2022-05-06

Número

Sección

5th Conference on Computer Science and Computer Engineering