Resumen:
|
[ES] Este Trabajo Fin de Máster analiza la gestión del riesgo de microcrédito de acuerdo con el método basado en calificaciones internas que se describe en el Acuerdo de Basilea II. Para su aplicación utiliza la base de ...[+]
[ES] Este Trabajo Fin de Máster analiza la gestión del riesgo de microcrédito de acuerdo con el método basado en calificaciones internas que se describe en el Acuerdo de Basilea II. Para su aplicación utiliza la base de datos de una institución bancaria de Ecuador. El objetivo principal es obtener la probabilidad de incumplimiento del pago del microcrédito, para lo cual se evalúa el desempeño de los siguientes modelos de aprendizaje automático de clasificación: Árbol de Decisión, Bosque Aleatorio, Máquina de Vectores de Soporte (SVM) y Regresión Logística. La metodología utilizada consta de: caracterización de la base de datos, selección de predictores, equilibrio del subconjunto de entrenamiento, aplicación de los modelos de clasificación y la explicación de las predicciones. Para evaluar los modelos se utilizó la matriz de confusión y el área bajo curva ROC (AUC). Para la implementación de los métodos se utilizó el lenguaje de programación R. El mejor modelo de acuerdo con la curva ROC es la Regresión Logística y el Bosque Aleatorio con un AUC de 0,9269 y 0,8844 respectivamente.
[-]
[EN] This Final Master’s thesis analyses microcredit risk management according to the internal
ratings-based method described in the Basel II Agreement. For its application it uses the
database of a banking institution ...[+]
[EN] This Final Master’s thesis analyses microcredit risk management according to the internal
ratings-based method described in the Basel II Agreement. For its application it uses the
database of a banking institution in Ecuador. The main objective is to obtain the probability of
default of microcredit payment, for which the performance of the following classification
machine learning models is evaluated: Decision Tree, Random Forest, Support Vector Machine
(SVM) and Logistic Regression. The methodology used consists of: characterization of the
database, selection of predictors, balance of the training subset, application of classification
models and explanation of predictions. The confusion matrix and the area under the ROC (AUC)
curve were used to evaluate the models. The best model according to the ROC curve is the
Logistic Regression and the Random Forest with an AUC of 0.9269 and 0.8844, respectively.
[-]
|