Sistema intérprete automático neuronal mazahua del norte del Estado de México a español

Autores/as

  • Lizeth De La Cruz Piña
  • Juan Alberto Antonio Velázquez
  • Ivan Vladimir Meza Ruiz
  • Erika López González
  • Leopoldo Gil Antonio

Palabras clave:

Lengua Mazahua, Traducción automática, Corpus, Transformer, Tokens, Subpalabras, BLEU

Resumen

En este artículo se presenta la creación del sistema de
traducción automática neuronal para lengua Mazahua al
español con variante del oriente, lengua hablada en el norte
del Estado de México y en el Estado de Michoacán. Esta
variante es conocida por los hablantes como jñatrjo. Las
pruebas de traducción fueron realizadas del español al
mazahua y en la creación del corpus, se utilizaron diferentes
fuentes escritas, posteriormente digitalizadas e
indispensables para la traducción automática. El corpus fue
constituido por 8,000 mil frases estimadas de bajos recursos
donde los datos fueron normalizados de manera automática.
Posteriormente el sistema planteado se retroalimenta en la
arquitectura neuronal Transformer y usa la tokenización a
grado de subpalabras como acceso. Se expone el presente
desempeño dado los recursos que fueron recolectados, dando
como resultado de un BLEU de 0.60.

Publicado

2022-05-06

Número

Sección

Conference on Computer Science and Computer Engineering