Selección de características mediante intersección de conjuntos en la tarea de Atribución de Autoría
Palabras clave:
Atribución de Autoría, Selección de características, Máquina de Soporte Vectorial, Regresión logística, Naive BayesResumen
Establecer la autoría requiere del análisis de rasgos lingüísticos o características que permitan identificar el estilo de escritura de cada autor, dentro del conjunto de características que describen el estilo de escritura de un autor hay características relevantes, irrelevantes y redundantes, por lo que se requieren métodos de selección de características que mejoren el desempeño del clasificador, en la presente investigación se implementó el método de clasificación de textos que consta de las siguientes etapas; adquisición de datos, análisis de datos y etiquetado, construcción de características y ponderación, selección y proyección de características, entrenamiento de un modelo de clasificación, y evaluación de la solución. En la etapa de Selección y proyección de características se propone la extracción de subconjuntos de características a partir de la intersección de conjuntos, y como se puede observar en la experimentación realizada se obtuvieron mejores resultados en comparación a los métodos de análisis de componentes principales, ganancia de información, puntuación de información mutua, máxima relevancia mínima de redundancia, y random Forest.