Pasar al contenido principal
Addressing overfitting in classification models for transport mode choice prediction: a practical application in the Aburrá Valley, Colombia img-publicaciones

El sobreajuste plantea una limitación significativa en la predicción de la elección de modo utilizando modelos de clasificación, a menudo empeorada por la proliferación de características de la codificación de variables categóricas. Si bien las técnicas de reducción de dimensionalidad se utilizan ampliamente, sus efectos en el rendimiento de los modelos de elección del modo de viaje aún no se han estudiado comparativamente. Esta investigación compara el impacto de los métodos de reducción de dimensionalidad (PCA, CATPCA, FAMD, LDA) en el rendimiento de modelos multinomiales y varios clasificadores de aprendizaje supervisado (XGBoost, Random Forest, Naive Bayes, K-Nearest Neighbors, Multinomial Logit) para predecir el modo de viaje. elección. Utilizando datos de encuestas del Valle de Aburrá en Colombia, detallamos el proceso de análisis de dimensiones derivadas y selección de modelos óptimos para predicciones generales y específicas de clase. Los resultados indican que la reducción de dimensiones mejora el poder predictivo, particularmente para modos de transporte menos comunes, proporcionando una estrategia para abordar el desequilibrio de clases sin modificar la distribución de datos. Esta metodología profundiza la comprensión del comportamiento de los viajes y ofrece información valiosa para modeladores y formuladores de políticas en regiones en desarrollo con características similares.

Ver artículo Árticulos
Facultad de Ciencias Económicas y Administrativas Departamento de Economía y Finanzas