Integrated models for predicting start-ups evolution

Mariia Garkavenko

Résumé

Startups play an increasingly important role in the modern economy. In this thesis, we study startup valuation and fundraising problems with machine learning and causal discovery methods. After reviewing the existing machine learning approaches to startup success prediction and the literature on startup valuation factors, we present a domain adaptation-based approach to predict startup valuations in funding rounds with known funding amounts. We show that funding rounds in which startup valuation is announced to the public are statistically different from those in which the valuation is kept secret. We mine a novel data source, Companies House, to learn the startup valuation in the later funding rounds and show that domain adaptation methods yield the best results for our task. Further, we collect a rich dataset of United Kingdom startups and their valuations and discover which variables make the best valuation predictors. Also, we apply causal discovery methods to learn which variables, directly and indirectly, affect startup valuation. We draw the connection to the previous startup valuation factors research and provide evidence for further theoretical studies. Finally, we propose a method for predicting whether a startup will secure a funding round based on publicly freely available information on the web. We propose methods to collect information about the startups and their funding rounds from different sources. Since it is impossible to collect the information about all the funding rounds, we propose to tackle the funding round prediction problem in the positive-unlabeled setting and show that this setting is beneficial for the neural network model.

Les startups jouent un rôle de plus en plus important dans l'économie moderne.Dans cette thèse, nous étudions la valorisation et le financement des startups à l'aide de méthodes d'apprentissage automatique et de découverte causale. Après avoir étudié les méthodes d'apprentissage automatique existantes pour prédire le succès des startups et la littérature sur les facteurs impactant la valorisation des startups, nous présentons une approche basée sur l'adaptation de domaine pour prédire la valorisation des startups au moment d'une levée de fonds dont le montant est connu. Nous montrons que les levées de fonds dans lesquelles la valorisation de la startup est annoncée publiquement sont statistiquement différentes de celles dans lesquelles la valorisation est gardée secrète.Nous exploitons une nouvelle source de données, "Companies House", pour apprendre à estimer la valorisation des startups lors des derniers tours de financement et nous montrons que les méthodes d'adaptation de domaine donnent les meilleurs résultats dans ce contexte. Cette source nous a permis de collecter un important jeux de données sur les startups du Royaume-Uni et leurs valorisations, nous permettant de découvrir quelles caractéristiques constituent les meilleurs prédicteurs de valorisation.De plus, nous appliquons des méthodes de découverte causale pour apprendre, à partir de ces données, quelles caractéristiques affectent, directement et indirectement, la valorisation des startups. Nous établissons un lien avec les précédentes recherches sur les facteurs de calcul de valorisation des startups et fournissons des preuves pour des études théoriques supplémentaires. Enfin, nous proposons une méthode pour prédire si une startup obtiendra une levée de fonds en se basant sur des informations publiques, librement disponibles sur le web. Nous proposons des méthodes pour collecter des informations sur les startups et leurs levées de fonds à partir de différentes sources.Puisqu'il est impossible de collecter des informations sur toutes les levées de fonds, nous proposons d'aborder le problème de leur prédiction comme un cas d'apprentissage positifs et indéterminés et montrons que ce type d'approche est bénéfique pour des modèles de réseaux de neurones.

Integrated models for predicting start-ups evolution

Modèles intégrés pour prévoir l'évolution des entreprises en démarrage

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager