Aplicación del algoritmo del bosque aleatorio a un modelo de clasificación de la anemia en niños peruanos

Bernardo Céspedes Panduro

Texto completo:

HTML PDF

Resumen

Introducción: en el Perú, durante los últimos años se observa una disminución de la pobreza. No obstante, la prevalencia de anemia continúa alta; afecta a 40,00 % de los niños de seis a 35 meses de edad.

Objetivo: identificar los factores de riesgo o pronósticos en la aparición de anemia en niños peruanos.

Métodos: se realizó un estudio observacional transversal a partir de la base de datos creada para la Encuesta Demográfica y de Salud Familiar, por el Instituto Nacional de Estadística e Informática durante los años 2015-2019. La población estuvo constituida por 57 410 niños de seis a 35 meses de edad, que contaban con exámenes de hemoglobina. Se seleccionaron 33 variables independientes y se plantearon seis procedimientos con el algoritmo del bosque aleatorio. Se obtuvieron valores de los indicadores área bajo la curva, especificidad y sensibilidad.

Resultados: el procedimiento que mejor predijo la presencia de anemia, con valores para los indicadores de especificidad (63,62 %) y sensibilidad (65,88 %) más similares, utilizó datos balanceados con reajuste de los parámetros, reducción de la cantidad de árboles y selección de variables.

Conclusiones: las cinco variables independientes más importantes para el modelo fueron: edad del niño, altitud del conglomerado, número de visitas prenatales por embarazo, momento del primer control prenatal y talla de la madre. El estudio aportó evidencias científicas acerca del uso de los algoritmos de aprendizaje automático para predecir la aparición de anemia en función de factores de riesgo comunes