Sistema intérprete automático neuronal mazahua del norte del Estado de México a español
Palabras clave:
Lengua Mazahua, Traducción automática, Corpus, Transformer, Tokens, Subpalabras, BLEUResumen
En este artículo se presenta la creación del sistema de
traducción automática neuronal para lengua Mazahua al
español con variante del oriente, lengua hablada en el norte
del Estado de México y en el Estado de Michoacán. Esta
variante es conocida por los hablantes como jñatrjo. Las
pruebas de traducción fueron realizadas del español al
mazahua y en la creación del corpus, se utilizaron diferentes
fuentes escritas, posteriormente digitalizadas e
indispensables para la traducción automática. El corpus fue
constituido por 8,000 mil frases estimadas de bajos recursos
donde los datos fueron normalizados de manera automática.
Posteriormente el sistema planteado se retroalimenta en la
arquitectura neuronal Transformer y usa la tokenización a
grado de subpalabras como acceso. Se expone el presente
desempeño dado los recursos que fueron recolectados, dando
como resultado de un BLEU de 0.60.