Logo do repositório
 
Publicação

Using big data in startup selection : exploring machine learning as a tool to predict successful startups in the age of social media

datacite.subject.fosCiências Sociais::Economia e Gestãopt_PT
dc.contributor.advisorLuzzi, Alessandra
dc.contributor.authorKiss, Barnabás
dc.date.accessioned2023-05-15T10:01:41Z
dc.date.available2023-05-15T10:01:41Z
dc.date.issued2022-10-19
dc.date.submitted2022-09
dc.description.abstractThis research aims to further explore the possibilities in the usage of Machine Learning within the Venture Capital industry. Building on previous research the goal of this paper is to determine whether social media analyses can improve the accuracy of Machine Learning models to predict startup outcomes and valuations for startup companies. The research is built on the following models: Multilayer Perceptron, XGBoost, RandomForest, Naive Bayes, and Voting Regressor. The data used in this research comes from Crunchbase, USPTO, and Twitter. The models in this research achieved an adjusted R2 of 0.5281 for value prediction, which shows that exit value is explainable to a large extent by using publicly available qualitative and quantitative data. Outcome prediction had precision for IPO between 0.1447 to 0.4193 and F1-scores between 0.2360 to 0.4449 for models built from Series A to Series C funding rounds. The results of this research show that Venture Capital firms investing from Series A to Series C would be able to outperform the market in terms of returns by implementing Machine Learning in their investment decision-making process. To further improve these results extracting further social media data is a beneficial future resource. Compared to previous models this research built models for 3 specific early funding rounds and can outperform the markets with data available for VCs at these points in time.pt_PT
dc.description.abstractEsta investigação visa explorar mais profundamente as possibilidades de utilização da aprendizagem mecânica na indústria do Venture Capital. Com base em pesquisas anteriores, o objectivo deste trabalho é determinar se as análises dos meios de comunicação social podem melhorar a precisão dos modelos de Machine Learning para prever os resultados e as avaliações das empresas em fase de arranque. A investigação baseia-se nos seguintes modelos: Multilayer Perceptron, XGBoost, RandomForest, Naive Bayes, e Voting Regressor. Os dados utilizados nesta pesquisa provêm de Crunchbase, USPTO, e Twitter. Os modelos nesta pesquisa alcançaram um R2 ajustado de 0,5281 para previsão de valor, o que mostra que o valor de saída é explicável em grande medida através da utilização de dados qualitativos e quantitativos disponíveis publicamente. A previsão de resultados teve precisão para IPO entre 0,1447 a 0,4193 e pontuações F1 entre 0,2360 a 0,4449 para modelos construídos das séries A a séries C de financiamento. Os resultados desta investigação mostram que as empresas de Venture Capital que investem da Série A à Série C seriam capazes de superar o mercado em termos de retorno, implementando a Machine Learning no seu processo de tomada de decisões de investimento. Para melhorar ainda mais estes resultados, extrair mais dados dos meios de comunicação social é um recurso futuro benéfico. Em comparação com modelos anteriores, esta investigação construiu modelos para 3 rondas de financiamento antecipado específicas e pode superar os mercados com dados disponíveis para VC nestes pontos no tempo.pt_PT
dc.identifier.tid203132513pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.14/41112
dc.language.isoengpt_PT
dc.subjectVenture Capitalpt_PT
dc.subjectMachine learningpt_PT
dc.subjectMLPpt_PT
dc.subjectXGBoostpt_PT
dc.subjectRandom Forestpt_PT
dc.subjectNaive Bayespt_PT
dc.subjectVoting regressorpt_PT
dc.subjectValue predictionpt_PT
dc.subjectOutcome predictionpt_PT
dc.subjectInvestment strategypt_PT
dc.titleUsing big data in startup selection : exploring machine learning as a tool to predict successful startups in the age of social mediapt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Gestão e Administração de Empresaspt_PT

Ficheiros

Principais
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
203132513.pdf
Tamanho:
3.88 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
203132513.txt
Tamanho:
3.44 KB
Formato:
Item-specific license agreed upon to submission
Descrição: