| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 723.12 KB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
This dissertation analyses how the predictive performance of football match outcome modelsevolves over the course of a season as additional information becomes available. While mostexisting studies evaluate predictive models using full-season data under the assumption ofstatic conditions, this study explicitly focuses on temporal performance dynamics and thepoint at which predictions become stable and reliable. Match-level data from six professionalEuropean football leagues across two competitive tiers are examined, including a structurallyregular season (2023/2024) and a disrupted season affected by the COVID-19 pandemic(2019/2020). Four modeling approaches are evaluated: Multinomial Logistic Regression(MLR) as a linear baseline, Random Forest (RF) and Gradient Boosting (GB) as non-lineartree-ensemble models, and a Multi-Layer Perceptron (MLP) representing a deep learningapproach. Model performance is assessed using time-based splits within each season,allowing predictive accuracy, discrimination and calibration to be analysed across successivephases of the season. To ensure methodological consistency and comparability, all modelsare trained using default hyperparameter settings and identical preprocessing pipelines.Performance is evaluated using Accuracy, Area Under the Receiver Operating CharacteristicCurve (AUC) and Logarithmic Loss, with particular emphasis on probabilistic calibrationand prediction stability. The results indicate that predictive performance improves over theseason, with ensemble-based models converging more rapidly toward stable performancethan linear models. Differences across leagues and competitive tiers are most pronouncedearly in the season, highlighting the importance of incorporating temporal considerationsinto football outcome prediction.
Esta dissertação analisa como o desempenho preditivo de modelos de previsão de resultadosde partidas de futebol evolui ao longo de uma temporada à medida que novas informaçõesse tornam disponíveis. Enquanto a literatura existente normalmente avalia modelos preditivos utilizando dados de temporadas completas e assumindo condições estáticas, esteestudo concentra-se explicitamente na dinâmica temporal do desempenho dos modelos e no momento em que as previsões se tornam estáveis e confiáveis. A análise utiliza dados em nível de partida de seis ligas profissionais europeias, abrangendo dois níveis competitivos incluindo uma temporada estruturalmente regular (2023/2024) e uma temporada afetadapor irregularidades decorrentes da pandemia de COVID-19 (2019/2020). Quatro abordagens de modelagem são avaliadas: Regressão Logística Multinomial como modelo linearde referência, Random Forest e Gradient Boosting como métodos não lineares baseadosem ensembles de árvores, e uma Rede Neural do tipo Multi-Layer Perceptron representando uma abordagem de aprendizado profundo. O desempenho dos modelos é avaliadopor meio de divisões temporais ao longo da temporada, permitindo a análise da acurácia, capacidade discriminativa e calibração das previsões em diferentes fases do campeonato.Para garantir consistência metodológica, todos os modelos utilizam configurações padrãode hiperparâmetros e pipelines de pré-processamento idênticos. A avaliação do desempenho é realizada com as métricas Accuracy, AUC e Logarithmic Loss, com ênfase na calibração probabilística e na estabilidade das previsões. Os resultados mostram que o desempenho melhora ao longo da temporada, com modelos baseados em ensembles atingindoestabilidade mais rapidamente, especialmente quando comparados a modelos lineares.
Esta dissertação analisa como o desempenho preditivo de modelos de previsão de resultadosde partidas de futebol evolui ao longo de uma temporada à medida que novas informaçõesse tornam disponíveis. Enquanto a literatura existente normalmente avalia modelos preditivos utilizando dados de temporadas completas e assumindo condições estáticas, esteestudo concentra-se explicitamente na dinâmica temporal do desempenho dos modelos e no momento em que as previsões se tornam estáveis e confiáveis. A análise utiliza dados em nível de partida de seis ligas profissionais europeias, abrangendo dois níveis competitivos incluindo uma temporada estruturalmente regular (2023/2024) e uma temporada afetadapor irregularidades decorrentes da pandemia de COVID-19 (2019/2020). Quatro abordagens de modelagem são avaliadas: Regressão Logística Multinomial como modelo linearde referência, Random Forest e Gradient Boosting como métodos não lineares baseadosem ensembles de árvores, e uma Rede Neural do tipo Multi-Layer Perceptron representando uma abordagem de aprendizado profundo. O desempenho dos modelos é avaliadopor meio de divisões temporais ao longo da temporada, permitindo a análise da acurácia, capacidade discriminativa e calibração das previsões em diferentes fases do campeonato.Para garantir consistência metodológica, todos os modelos utilizam configurações padrãode hiperparâmetros e pipelines de pré-processamento idênticos. A avaliação do desempenho é realizada com as métricas Accuracy, AUC e Logarithmic Loss, com ênfase na calibração probabilística e na estabilidade das previsões. Os resultados mostram que o desempenho melhora ao longo da temporada, com modelos baseados em ensembles atingindoestabilidade mais rapidamente, especialmente quando comparados a modelos lineares.
Descrição
Palavras-chave
Football match outcome prediction Predictive analytics Temporal performance dynamics
Contexto Educativo
Citação
Editora
Licença CC
Sem licença CC
