Name: | Description: | Size: | Format: | |
---|---|---|---|---|
1.71 MB | Adobe PDF |
Advisor(s)
Abstract(s)
This dissertation aims to enhance the performance of traditional corporate bankruptcy prediction models through the application of machine learning techniques and models, and industry effects. The data used includes 3664 companies out of which 144 went bankrupt throughout the period of 2000 until 2019, and it was structured to emulate the design of the variables Campbell et al. (2008) used in their study. Evidence was found that implies the improvement of various metrics’ results from the use of machine learning techniques and models. The model with the highest F1-score, meaning the most balanced, is the Logit with the application of hyperparameter tuning and industry effects. The model with the highest Recall, which means the percentage of bankruptcies correctly predicted, is the Logit with the application of the oversampling technique. Furthermore, both Support Vector Machines (SVM) and Artificial Neural Networks (NN) models delivered balanced and enhanced results compared with the two benchmarks (Altman Z-Score and Simple Logit models). The improvement techniques provided the models with distinct results. Oversampling led mostly to a higher percentage of bankruptcies predicted, while hyperparameter tuning and industry effects provided the models with more precise results. The variable importance in each type of model was also analysed. Overall, the Campbell et al. (2008) market variables (SIGMA, RSIZE, EXRET and PRICE) are highly significant for the positive results of all three types of models studied.
Esta dissertação tem como objetivo melhorar o desempenho de modelos tradicionais de previsão de falência corporativa através da aplicação de técnicas e modelos de machine learning, e efeitos de indústria. A data usada incluí 3664 empresas das quais 144 faliram no período de 2000 até 2019, e foi estruturada para emular o desenho de variáveis que Campbell et al. (2008) utilizaram no seu estudo. Evidências foram encontradas que indicam a melhoria dos resultados de várias métricas através do uso de técnicas e modelos de machine learning. O modelo com maior F1-Score, isto é, o mais equilibrado, é o Logit com a aplicação de ajuste de hiperparâmetros e efeitos de indústria. O modelo com maior Recall, ou seja, a percentagem de falências corretamente previstas, é o Logit com a aplicação da técnica de sobreamostragem. Ademais, ambos os modelos de Máquina de Vetores de Suporte (MVS) e Redes Neurais Artificiais (RN) forneceram resultados equilibrados e melhorados em comparação com os modelos de referência (Atlman Z-Score e Logit Simples). As técnicas de melhoramento geraram resultados diferentes aos modelos. Sobreamostragem levou a maiores percentagens de falência prevista, enquanto o ajuste de hiperparâmetros e os efeitos de indústria forneceram aos modelos resultados mais precisos. A importância de variáveis nos diferentes tipos de modelo também foi analisada. Em geral, as variáveis de mercado de Campbell et al. (2008) (SIGMA, RSIZE, EXRET e PRICE) são bastante significativas para os resultados positivos dos três diferentes tipos de modelo estudados.
Esta dissertação tem como objetivo melhorar o desempenho de modelos tradicionais de previsão de falência corporativa através da aplicação de técnicas e modelos de machine learning, e efeitos de indústria. A data usada incluí 3664 empresas das quais 144 faliram no período de 2000 até 2019, e foi estruturada para emular o desenho de variáveis que Campbell et al. (2008) utilizaram no seu estudo. Evidências foram encontradas que indicam a melhoria dos resultados de várias métricas através do uso de técnicas e modelos de machine learning. O modelo com maior F1-Score, isto é, o mais equilibrado, é o Logit com a aplicação de ajuste de hiperparâmetros e efeitos de indústria. O modelo com maior Recall, ou seja, a percentagem de falências corretamente previstas, é o Logit com a aplicação da técnica de sobreamostragem. Ademais, ambos os modelos de Máquina de Vetores de Suporte (MVS) e Redes Neurais Artificiais (RN) forneceram resultados equilibrados e melhorados em comparação com os modelos de referência (Atlman Z-Score e Logit Simples). As técnicas de melhoramento geraram resultados diferentes aos modelos. Sobreamostragem levou a maiores percentagens de falência prevista, enquanto o ajuste de hiperparâmetros e os efeitos de indústria forneceram aos modelos resultados mais precisos. A importância de variáveis nos diferentes tipos de modelo também foi analisada. Em geral, as variáveis de mercado de Campbell et al. (2008) (SIGMA, RSIZE, EXRET e PRICE) são bastante significativas para os resultados positivos dos três diferentes tipos de modelo estudados.
Description
Keywords
Corporate bankruptcy prediction Machine learning Logit models Support vector machines Artificial neural networks Previsão de falência corporativa Modelos logit Máquina de vetores de suporte Redes neurais artificiais