| Autor: David Díaz Paz y Puente | Matrícula: 650794 |
Este directorio contiene la resolución de la actividad A2.1, en la cual se aborda un problema de clasificación supervisada para predecir el estrato socioeconómico de los hogares (est_socio).
A diferencia de etapas anteriores donde se estimaba el ingreso per cápita de forma continua, en este proyecto el problema se reformuló para predecir a qué categoría pertenece un hogar de acuerdo con sus características estructurales y condiciones de vivienda. Las clases a predecir son cuatro categorías ordinales:
El objetivo principal es entrenar y evaluar un modelo de Regresión Logística robusto, asegurando su capacidad de generalización mediante validación cruzada y realizando una interpretación profunda de sus métricas, umbrales y coeficientes.
main.ipynb: Jupyter Notebook principal que contiene todo el código fuente. Incluye desde la carga y separación de los datos, hasta el entrenamiento mediante Pipelines, validación cruzada, evaluación en el conjunto de prueba y el análisis visual/estadístico del modelo.features_lasso.csv: Conjunto de datos utilizado para el entrenamiento y prueba del modelo. Contiene las características de las viviendas previamente seleccionadas.El desarrollo del modelo en main.ipynb / main.html sigue un flujo de trabajo estructurado de Machine Learning:
stratify=y) para mantener el balance original de las clases.Pipeline integrando estandarización (StandardScaler) y el modelo clasificador (LogisticRegression).estim_pago, drenaje_2, eli_basura_4) actúan como “drivers” de pobreza o riqueza en la toma de decisión del algoritmo.