Aplicación de minería de datos mediante la metodología CRISP-DM para defunciones accidentales y violentas en Nezahualcóyotl

Autores/as

  • Miguel Rubén Marcial Rodríguez
  • Argenis Gabriel López Montaño
  • Liliana Rodríguez Páez
  • Ricardo Rico Molina
  • Doricela Gutiérrez Cruz

Palabras clave:

Análisis de datos, clasificador, mortalidad, Naive Bayes, WEKA

Resumen

La minería de datos es una técnica que consiste en la aplicación de algoritmos específicos que generan una enumeración de patrones a partir de grandes volúmenes de información. Para realizar estos análisis existen diversas metodologías, una de ellas es la CRISP MD. En este artículo se presenta la aplicación de la metodología CRISP MD (Cross Industry Standar Process for Data Mining) la cual es una metodología imparcial o neutra respecto a la herramienta que se utilice Data Warehouse o Minería de Datos. Con el objetivo de clasificar las defunciones accidentales y violentas en el municipio de Nezahualcóyotl, identificando, el tipo de defunción, de acuerdo al género, escolaridad, edad, en un periodo de enero-diciembre entre los años de 1990 a 2018, utilizando el clasificador Naive Bayes y la técnica de árboles de decisión J48 mediante el software de WEKA. Después del análisis de los datos fue posible identificar que la variable sexo, nivel de escolaridad y el rango de edad fueron claves para detectar que defunción fue la más causada en el municipio de Nezahualcóyotl. Estos resultados muestran que con el clasificador Naive Bayes en combinación con otros algoritmos de clasificación podrían ser útil para aplicarlos en futuros análisis en una amplia variedad de datos para identificar patrones de comportamiento.

Publicado

2023-05-29

Número

Sección

Conference on Computer Science and Computer Engineering