| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 4.08 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
Customer Relationship Management has become increasingly vital for business success in the digital transformation era. In particular, customer churn prediction has emerged as a crucial task for subscription-based services like Software-as-a-Service (SaaS). This study investigates churn prediction at E-goi, a B2B SaaS company focused on customer relationship marketing, by applying various machine learning techniques within the CRISP-DM framework. The primary objective was to identify the most effective predictive model and evaluate its practical implications for customer retention strategies. The methodology included testing models using three different sampling techniques, undersampling, SMOTE, and original class distribution. Random Forest, XGBoost, Decision Tree, Logistic Regression, Feedforward Neural Network (FNN), and k-Nearest Neighbours (KNN) were chosen to be tested and assessed using F1-score as the primary metric due to the imbalanced nature of the dataset. Grid Search hyperparameters tuning was applied to find the best parameters before final model training. Time-sliced cross validation (TSCV) approach was chosen to validate the results to maintain the chronological integrity. The RF and XGBoost using the original class distribution emerged as the most effective models, achieving F1-scores of 0,6752 and 0,6703, respectively. While RF demonstrated superior recall, making it better at detecting actual churners, XGBoost showed higher precision, minimising false positives. Sampling techniques, including SMOTE and undersampling, did not consistently improve model performance, with the original data distribution yielding the most reliable results. The study also employed SHAP to analyse feature importance, revealing that variables related to payment activity and customer engagement were the most influential predictors of churn. These insights underline the importance of proactive monitoring of key customer behaviours to mitigate churn risks.
A Gestão de Relacionamento com o Cliente (CRM) é essencial para o sucesso de empresas na era digital, especialmente em modelos de negócio baseados em assinaturas, como o Software como Serviço (SaaS). Este estudo tem como foco a previsão de churn na E-goi, uma empresa B2B SaaS voltada ao marketing de relacionamento, por meio da aplicação de técnicas de aprendizado de máquina dentro do framework CRISP-DM. O objetivo principal foi identificar o modelo preditivo mais eficaz e avaliar seu impacto em estratégias de retenção de clientes. Foram testados seis algoritmos: Random Forest, XGBoost, Árvore de Decisão, Regressão Logística, Rede Neural Feedforward (FNN) e k-Nearest Neighbours (KNN), utilizando F1-score como métrica principal, dado o desbalanceamento das classes. Três estratégias de amostragem foram avaliadas: undersampling, SMOTE e a distribuição original das classes. A otimização dos hiperparâmetros foi realizada por meio de Grid Search, e a validação dos modelos adotou o método de validação cruzada com divisão temporal (TSCV), preservando a ordem cronológica dos dados. Os modelos Random Forest e XGBoost, ambos com a distribuição original das classes, apresentaram os melhores desempenhos, com F1-scores de 0,6752 e 0,6703, respectivamente. O Random Forest destacou-se pelo maior recall, eficaz na detecção de clientes propensos ao churn, enquanto o XGBoost obteve maior precisão, reduzindo falsos positivos. As técnicas de amostragem alternativas não melhoraram consistentemente o desempenho. A análise de importância das variáveis, conduzida com SHAP, indicou que fatores relacionados a pagamentos e engajamento do cliente são os principais preditores de churn. Esses achados reforçam a relevância do monitoramento proativo de comportamentos-chave para a redução da rotatividade de clientes.
A Gestão de Relacionamento com o Cliente (CRM) é essencial para o sucesso de empresas na era digital, especialmente em modelos de negócio baseados em assinaturas, como o Software como Serviço (SaaS). Este estudo tem como foco a previsão de churn na E-goi, uma empresa B2B SaaS voltada ao marketing de relacionamento, por meio da aplicação de técnicas de aprendizado de máquina dentro do framework CRISP-DM. O objetivo principal foi identificar o modelo preditivo mais eficaz e avaliar seu impacto em estratégias de retenção de clientes. Foram testados seis algoritmos: Random Forest, XGBoost, Árvore de Decisão, Regressão Logística, Rede Neural Feedforward (FNN) e k-Nearest Neighbours (KNN), utilizando F1-score como métrica principal, dado o desbalanceamento das classes. Três estratégias de amostragem foram avaliadas: undersampling, SMOTE e a distribuição original das classes. A otimização dos hiperparâmetros foi realizada por meio de Grid Search, e a validação dos modelos adotou o método de validação cruzada com divisão temporal (TSCV), preservando a ordem cronológica dos dados. Os modelos Random Forest e XGBoost, ambos com a distribuição original das classes, apresentaram os melhores desempenhos, com F1-scores de 0,6752 e 0,6703, respectivamente. O Random Forest destacou-se pelo maior recall, eficaz na detecção de clientes propensos ao churn, enquanto o XGBoost obteve maior precisão, reduzindo falsos positivos. As técnicas de amostragem alternativas não melhoraram consistentemente o desempenho. A análise de importância das variáveis, conduzida com SHAP, indicou que fatores relacionados a pagamentos e engajamento do cliente são os principais preditores de churn. Esses achados reforçam a relevância do monitoramento proativo de comportamentos-chave para a redução da rotatividade de clientes.
Description
Keywords
Customer churn prediction CRM SaaS Machine learning Random forest XGBoost SHAP Analysis CRISP-DM Retention strategies Previsão de churn de clientes Aprendizado de máquina Análise SHAP Estratégias de retenção
Pedagogical Context
Citation
Publisher
CC License
Without CC licence
