Apprentissage séquentiel budgétisé pour la classification extrême et la découverte de hiérarchie en apprentissage par renforcement

Aurélia Léon

Thèse Année : 2019

Budgeted sequential learning for extreme classification and for the discovery of hierarchy in reinforcement learning

Apprentissage séquentiel budgétisé pour la classification extrême et la découverte de hiérarchie en apprentissage par renforcement

(1)

Aurélia Léon

Fonction : Auteur
PersonId : 988008

Machine Learning and Information Access

Résumé

This thesis deals with the notion of budget to study problems of complexity (it can be computational complexity, a complex task for an agent, or complexity due to a small amount of data). Indeed, the main goal of current techniques in machine learning is usually to obtain the best accuracy, without worrying about the cost of the task. The concept of budget makes it possible to take into account this parameter while maintaining good performances. We first focus on classification problems with a large number of classes: the complexity in those algorithms can be reduced thanks to the use of decision trees (here learned through budgeted reinforcement learning techniques) or the association of each class with a (binary) code. We then deal with reinforcement learning problems and the discovery of a hierarchy that breaks down a (complex) task into simpler tasks to facilitate learning and generalization. Here, this discovery is done by reducing the cognitive effort of the agent (considered in this work as equivalent to the use of an additional observation). Finally, we address problems of understanding and generating instructions in natural language, where data are available in small quantities: we test for this purpose the simultaneous use of an agent that understands and of an agent that generates the instructions.

Cette thèse s’intéresse à la notion de budget pour étudier des problèmes de complexité (complexité en calculs, tâche complexe pour un agent, ou complexité due à une faible quantité de données). En effet, l’objectif principal des techniques actuelles en apprentissage statistique est généralement d’obtenir les meilleures performances possibles, sans se soucier du coût de la tâche. La notion de budget permet de prendre en compte ce paramètre tout en conservant de bonnes performances. Nous nous concentrons d’abord sur des problèmes de classification en grand nombre de classes : la complexité en calcul des algorithmes peut être réduite grâce à l’utilisation d’arbres de décision (ici appris grâce à des techniques d’apprentissage par renforcement budgétisées) ou à l’association de chaque classe à un code (binaire). Nous nous intéressons ensuite aux problèmes d’apprentissage par renforcement et à la découverte d’une hiérarchie qui décompose une tâche en plusieurs tâches plus simples, afin de faciliter l’apprentissage et la généralisation. Cette découverte se fait ici en réduisant l’effort cognitif de l’agent (considéré dans ce travail comme équivalent à la récupération et à l’utilisation d’une observation supplémentaire). Enfin, nous abordons des problèmes de compréhension et de génération d’instructions en langage naturel, où les données sont disponibles en faible quantité : nous testons dans ce but l’utilisation jointe d’un agent qui comprend et d’un agent qui génère les instructions.

Mots clés

Neural networks Reinforcement learning Classification Hierarchy Options Language Deep learning

Réseaux de neurones Apprentissage par renforcement Classification Hiérarchie Options Langage Apprentissage profond

Domaines

Intelligence artificielle [cs.AI] Apprentissage [cs.LG]

Fichier principal

LEON_Aurelia_2019.pdf (8.5 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-02954134

Soumis le : mercredi 30 septembre 2020-18:16:57

Dernière modification le : samedi 7 octobre 2023-21:36:22

Archivage à long terme le : lundi 4 janvier 2021-08:46:06

Dates et versions

tel-02954134 , version 1 (30-09-2020)

Identifiants

HAL Id : tel-02954134 , version 1

Citer

Aurélia Léon. Apprentissage séquentiel budgétisé pour la classification extrême et la découverte de hiérarchie en apprentissage par renforcement. Intelligence artificielle [cs.AI]. Sorbonne Université, 2019. Français. ⟨NNT : 2019SORUS226⟩. ⟨tel-02954134⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS STAR LIP6 SORBONNE-UNIVERSITE THESES-SU SU-SCIENCES

158 Consultations

98 Téléchargements

Budgeted sequential learning for extreme classification and for the discovery of hierarchy in reinforcement learning

Apprentissage séquentiel budgétisé pour la classification extrême et la découverte de hiérarchie en apprentissage par renforcement

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager