Repository logo
 
Publication

Predicting credit card defaults : a comparative analysis of machine learning models

datacite.subject.fosCiências Sociais::Economia e Gestãopt_PT
dc.contributor.advisorRotondi, Francesco
dc.contributor.authorJackwitz, Marc Leon
dc.date.accessioned2025-01-21T11:11:00Z
dc.date.embargo2026-01-21
dc.date.issued2024-10-17
dc.date.submitted2024-09-07
dc.description.abstractIn a time of rising interest rates and economic difficulties, the accurate prediction of credit card defaults is essential for financial institutions. In this master thesis, different machine learning models are evaluated to improve the predictive performance compared to traditional methods. Models such as XGBoost, Random Forest, K-Nearest Neighbor, Neural Networks and Support Vector Machines are developed and compared to the Logistic Regression. Performances are evaluated based on accuracy, precision, recall and F1-score and compared to their computation time as a cost factor. The learning curves are then analyzed to identify possible over- or underfitting. Finally, the importance of each feature is reviewed to gain an understanding of which data banks should include in their analysis. The results show that all advanced machine learning models outperform the Logistic Regression, with XGBoost coming out on top. However, KNN lags behind the other models. Key features identified include payment status and closeness to credit limit. Therefore, this study underlines the potential of advanced machine learning models to improve the prediction of credit card defaults, but also highlights the need for institution specific analysis due to data variability and computational complexity.pt_PT
dc.description.abstractEm um período de aumento das taxas de juros e dificuldades econômicas, a previsão precisa de inadimplências de cartões de crédito é essencial para as instituições financeiras. Nesta tese de mestrado, diferentes modelos de machine learning são avaliados para melhorar o desempenho preditivo em comparação com métodos tradicionais. Modelos como XGBoost, Random Forest, K-Nearest Neighbor, Neural Networks e Support Vector Machines são desenvolvidos e comparados à Regressão Logística. Os desempenhos são avaliados com base em acurácia, precisão, recall e F1-score, e comparados com o tempo de computação como um fator de custo. As curvas de aprendizado são então analisadas para identificar possíveis overfitting ou underfitting. Finalmente, a importância de cada feature é revisada para entender quais dados os bancos devem incluir em suas análises. Os resultados mostram que todos os modelos avançados de machine learning superam a Regressão Logística, com o XGBoost se destacando. No entanto, o KNN fica atrás dos outros modelos. As principais features identificadas incluem status de pagamento e proximidade do limite de crédito. Portanto, este estudo sublinha o potencial dos modelos avançados de machine learning para melhorar a previsão de inadimplências de cartões de crédito, mas também destaca a necessidade de análises específicas para cada instituição devido à variabilidade dos dados e à complexidade computacional.pt_PT
dc.identifier.tid203730160pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.14/47838
dc.language.isoengpt_PT
dc.subjectCredit card defaultspt_PT
dc.subjectMachine learningpt_PT
dc.subjectPredictive modelingpt_PT
dc.subjectFinancial risk analysispt_PT
dc.subjectIncumprimentos de cartões de créditopt_PT
dc.subjectModelação preditivapt_PT
dc.subjectAnálise de risco financeiropt_PT
dc.titlePredicting credit card defaults : a comparative analysis of machine learning modelspt_PT
dc.title.alternativePrevisão de incumprimentos de cartões de crédito : uma análise comparativa dos modelos de aprendizagem automáticapt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsembargoedAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Finanças (mestrado internacional)pt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
203730160.pdf
Size:
3.17 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.44 KB
Format:
Item-specific license agreed upon to submission
Description: