| Nome: | Descrição: | Tamanho: | Formato: | |
|---|---|---|---|---|
| 3.88 MB | Adobe PDF |
Autores
Orientador(es)
Resumo(s)
This research aims to further explore the possibilities in the usage of Machine Learning within
the Venture Capital industry. Building on previous research the goal of this paper is to
determine whether social media analyses can improve the accuracy of Machine Learning
models to predict startup outcomes and valuations for startup companies. The research is built
on the following models: Multilayer Perceptron, XGBoost, RandomForest, Naive Bayes, and
Voting Regressor. The data used in this research comes from Crunchbase, USPTO, and
Twitter.
The models in this research achieved an adjusted R2 of 0.5281 for value prediction, which
shows that exit value is explainable to a large extent by using publicly available qualitative
and quantitative data. Outcome prediction had precision for IPO between 0.1447 to 0.4193
and F1-scores between 0.2360 to 0.4449 for models built from Series A to Series C funding
rounds.
The results of this research show that Venture Capital firms investing from Series A to Series
C would be able to outperform the market in terms of returns by implementing Machine
Learning in their investment decision-making process. To further improve these results
extracting further social media data is a beneficial future resource. Compared to previous
models this research built models for 3 specific early funding rounds and can outperform the
markets with data available for VCs at these points in time.
Esta investigação visa explorar mais profundamente as possibilidades de utilização da aprendizagem mecânica na indústria do Venture Capital. Com base em pesquisas anteriores, o objectivo deste trabalho é determinar se as análises dos meios de comunicação social podem melhorar a precisão dos modelos de Machine Learning para prever os resultados e as avaliações das empresas em fase de arranque. A investigação baseia-se nos seguintes modelos: Multilayer Perceptron, XGBoost, RandomForest, Naive Bayes, e Voting Regressor. Os dados utilizados nesta pesquisa provêm de Crunchbase, USPTO, e Twitter. Os modelos nesta pesquisa alcançaram um R2 ajustado de 0,5281 para previsão de valor, o que mostra que o valor de saída é explicável em grande medida através da utilização de dados qualitativos e quantitativos disponíveis publicamente. A previsão de resultados teve precisão para IPO entre 0,1447 a 0,4193 e pontuações F1 entre 0,2360 a 0,4449 para modelos construídos das séries A a séries C de financiamento. Os resultados desta investigação mostram que as empresas de Venture Capital que investem da Série A à Série C seriam capazes de superar o mercado em termos de retorno, implementando a Machine Learning no seu processo de tomada de decisões de investimento. Para melhorar ainda mais estes resultados, extrair mais dados dos meios de comunicação social é um recurso futuro benéfico. Em comparação com modelos anteriores, esta investigação construiu modelos para 3 rondas de financiamento antecipado específicas e pode superar os mercados com dados disponíveis para VC nestes pontos no tempo.
Esta investigação visa explorar mais profundamente as possibilidades de utilização da aprendizagem mecânica na indústria do Venture Capital. Com base em pesquisas anteriores, o objectivo deste trabalho é determinar se as análises dos meios de comunicação social podem melhorar a precisão dos modelos de Machine Learning para prever os resultados e as avaliações das empresas em fase de arranque. A investigação baseia-se nos seguintes modelos: Multilayer Perceptron, XGBoost, RandomForest, Naive Bayes, e Voting Regressor. Os dados utilizados nesta pesquisa provêm de Crunchbase, USPTO, e Twitter. Os modelos nesta pesquisa alcançaram um R2 ajustado de 0,5281 para previsão de valor, o que mostra que o valor de saída é explicável em grande medida através da utilização de dados qualitativos e quantitativos disponíveis publicamente. A previsão de resultados teve precisão para IPO entre 0,1447 a 0,4193 e pontuações F1 entre 0,2360 a 0,4449 para modelos construídos das séries A a séries C de financiamento. Os resultados desta investigação mostram que as empresas de Venture Capital que investem da Série A à Série C seriam capazes de superar o mercado em termos de retorno, implementando a Machine Learning no seu processo de tomada de decisões de investimento. Para melhorar ainda mais estes resultados, extrair mais dados dos meios de comunicação social é um recurso futuro benéfico. Em comparação com modelos anteriores, esta investigação construiu modelos para 3 rondas de financiamento antecipado específicas e pode superar os mercados com dados disponíveis para VC nestes pontos no tempo.
Descrição
Palavras-chave
Venture Capital Machine learning MLP XGBoost Random Forest Naive Bayes Voting regressor Value prediction Outcome prediction Investment strategy
