| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 2.07 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
This dissertation investigates whether news sentiment, extracted via dictionary methods or modern LLMs, provides incremental predictive power for S&P 500 corporate earnings surprises.Using 70,133 firm-quarter observations (2000–2024), we compare two sentiment sources (Harvard IV-4 dictionary, Mistral LLM) across seven ML architectures. No sentiment configuration significantly outperforms the controls-only baseline to predict SUE (best Ensemble R2:5.47% controls-only), establishing a comprehensive null result. Within this null, three findingsstand out: (1) out-of-sample R2 varies substantially across sub-periods, yet sentiment never outperforms controls in any regime; (2) SHAP analysis attributes 64–68% of feature importanceto lagged SUE, with combined sentiment contributing only 6–8%; and (3) a long/short strategy based on predicted SUE quartiles yields uniformly negative and statistically insignificantFama-French three-factor alphas, indicating that predictability does not translate into economicvalue. These findings indicate that for large-cap firms, news sentiment introduces estimationnoise rather than incremental signal, suggesting that the information content of financial newsis already captured by the structured financial variables it ultimately reflects.
Esta dissertação investiga se o sentimento de notícias, extraído via métodos de dicionário ou LLMs modernos, fornece poder preditivo incremental para surpresas de lucros corporativos do S&P 500. Usando 70.133 observações firma-trimestre (2000–2024), comparamos duas fontes de sentimento (dicionário Harvard IV-4, LLM Mistral) através de sete arquiteturas ML. Nenhuma configuração de sentimento supera significativamente a baseline apenas com controles na previsão do SUE (melhor R<sup>2</sup> Ensemble: 5,47%), estabelecendo um resultado nulo abrangente. Dentro deste resultado nulo, três achados destacam-se: (1) o R2 fora da amostra varia substancialmente entre subperíodos, mas o sentimento nunca supera os controles em nenhum regime; (2) a analise SHAP atribui 64–68% da importância das variáveis ao SUE defasado, com o sentimento combinado a contribuir apenas 6–8%; e (3) uma estratégia long/short baseada em quartis do SUE previsto gera alfas Fama-French de três fatores uniformemente negativos e estatisticamente insignificantes, indicando que a previsibilidade não se traduz em valor económico. Estes resultados indicam que, para empresas de grande capitalização, o sentimento de notícias introduz ruído de estimação em vez de sinal incremental, sugerindo que o conteúdo informacional das notícias financeiras já se encontra capturado pelas variáveis financeiras estruturadas que estas refletem.
Esta dissertação investiga se o sentimento de notícias, extraído via métodos de dicionário ou LLMs modernos, fornece poder preditivo incremental para surpresas de lucros corporativos do S&P 500. Usando 70.133 observações firma-trimestre (2000–2024), comparamos duas fontes de sentimento (dicionário Harvard IV-4, LLM Mistral) através de sete arquiteturas ML. Nenhuma configuração de sentimento supera significativamente a baseline apenas com controles na previsão do SUE (melhor R<sup>2</sup> Ensemble: 5,47%), estabelecendo um resultado nulo abrangente. Dentro deste resultado nulo, três achados destacam-se: (1) o R2 fora da amostra varia substancialmente entre subperíodos, mas o sentimento nunca supera os controles em nenhum regime; (2) a analise SHAP atribui 64–68% da importância das variáveis ao SUE defasado, com o sentimento combinado a contribuir apenas 6–8%; e (3) uma estratégia long/short baseada em quartis do SUE previsto gera alfas Fama-French de três fatores uniformemente negativos e estatisticamente insignificantes, indicando que a previsibilidade não se traduz em valor económico. Estes resultados indicam que, para empresas de grande capitalização, o sentimento de notícias introduz ruído de estimação em vez de sinal incremental, sugerindo que o conteúdo informacional das notícias financeiras já se encontra capturado pelas variáveis financeiras estruturadas que estas refletem.
Descrição
Palavras-chave
Supervised learning Financial news sentiment Standardized unexpected earnings Aprendizagem supervisionada Sentimento de notícias financeiras Lucros inesperados padronizados
Contexto Educativo
Citação
Editora
Licença CC
Sem licença CC
