ia_models

A2.3 Modelos de ensamble, SVM y Redes Neuronales

Descripción General

Esta actividad consiste en analizar el comportamiento y resolver un problema de clasificación mediante el entrenamiento y comparación de distintos modelos avanzados: Random Forest, Boosting (AdaBoost), Support Vector Machine (SVM) y Redes Neuronales (MLP). El objetivo es evaluar el desempeño de estos enfoques para diagnosticar el estrato socioeconómico de una familia basándose en las condiciones de su vivienda.

Base de Datos

Origen: Los datos provienen de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2024, específicamente de la muestra correspondiente al estado de Nuevo León.
Variable de salida: Se clasifica el estrato socioeconómico en cuatro categorías: Bajo (1), Medio bajo (2), Medio alto (3) y Alto (4).
Variables de entrada: El conjunto de datos consta de 3,767 observaciones y utiliza 44 variables predictoras previamente seleccionadas mediante el método LASSO, las cuales se encuentran almacenadas en el archivo features_lasso.csv.

Índice de Archivos

main.ipynb: Notebook principal con el desarrollo del código, optimización de hiperparámetros (mediante RandomizedSearchCV y GridSearchCV) y evaluación de los modelos implementados.
main.pdf: Reporte detallado de la actividad en formato PDF que incluye la introducción, metodología, resultados comparativos y conclusiones.
main.html: Versión exportada en HTML para visualización rápida del análisis.
features_lasso.csv: Dataset que contiene las características seleccionadas utilizadas para el entrenamiento (70%) y prueba (30%) de los modelos.