Evaluating the impact of machine learning models in SME credit risk assessment

Litvinenco, Eugeniu

http://hdl.handle.net/10400.14/44813

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
203589793.pdf		4.43 MB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Litvinenco, Eugeniu

Orientador(es)

Bertani, Nicolò

Resumo(s)

In recent years, there has been a significant increase in research efforts to incorporate machine learning (ML) models into credit risk assessment. This study focuses on the credit risk assessment of small and medium-sized enterprises (SMEs), which represent a significant source of employment in most economies. According to the regulator, while ML methods can provide added value, through a more accurate assessment of capital requirements, thus facilitating the access of this segment to financial services, there is a gap in the implementation of these methodologies in real-world context. This can be due to the overall complexity of explainability and interpretability, which forces financial institutions to use simpler models. Another reason is the lack of clarity on the benefits that these methodologies can provide. In this study, a hybrid model combining a decision tree and a logistic regression is proposed to address the complexity problem. This model shows comparable performance to the Random Forest and XGBoost while providing interpretability complexity equivalent to a logistic regression. In addition, this study introduces two innovative metrics, Exposure Weighted Distance to Default (EWDD) and Exposure Weighted Rating (EWR), which aim to find a way to distinguish the misclassifications made by a model according to their capital significance and to provide a sense of the total capital requirements that a model can generate. These metrics, along with the commonly used, were employed to compare the models, enabling the financial institutions to make a more informed decision in selecting the model that best meets their objectives.

Recentemente, tem-se vindo a registar um aumento dos esforços de investigação na aplicação de modelos machine leraning (ML) na avaliação do risco de crédito. Este estudo centra-se na avaliação do risco de crédito das Pequenas e Médias Empresas (PME), que representam uma fonte significativa de emprego na maioria das economias. De acordo com o regulador, embora os métodos de ML possam proporcionar valor acrescentado, através de uma avaliação mais exata dos requisitos de capital facilitando assim o acesso deste segmento aos serviços financeiros, existe uma disparidade na implementação destas tecnologias no contexto real. Tal pode dever-se à complexidade da explicabilidade e interpretabilidade, que força as instituições financeiras a utilizar modelos mais simples. Outra razão é a falta de clareza sobre os benefícios que estas metodologias podem proporcionar. Neste estudo, é proposto um modelo híbrido que combina uma árvore de decisão e uma regressão logística contornando o problema da complexidade. Este modelo apresenta um desempenho comparável aos modelos Random Forest e XGBoost apresentando uma complexidade de interpretação equivalente à regressão logística. Adicionalmente, são propostas duas métricas, Exposure Weighted Distance to Default (EWDD) e Exposure Weighted Rating (EWR), cujo objetivo é distinguir as classificações erradas feitas por um modelo de acordo com a sua importância capital e fornecer uma perceção dos requisitos totais de capital que um modelo pode gerar. Estas métricas, juntamente com as métricas habituais, foram utilizadas para comparar os modelos, permitindo uma decisão mais informada na seleção do modelo que melhor satisfaz os objetivos de uma instituição financeira.

Palavras-chave

SME Machine learning Credit risk Hybrid model Exposure weighted metric PME Risco de crédito Modelo híbrido Métrica ponderada pela exposição

URI

http://hdl.handle.net/10400.14/44813

Coleções

R - Dissertações de Mestrado / Master Dissertations
CLSBE - Dissertações de Mestrado / Master Dissertations

Ver registo completo