• xmlui.mirage2.page-structure.header.title
    • français
    • English
  • Help
  • Login
  • Language 
    • Français
    • English
View Item 
  •   BIRD Home
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Thèses
  • View Item
  •   BIRD Home
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Thèses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

BIRDResearch centres & CollectionsBy Issue DateAuthorsTitlesTypeThis CollectionBy Issue DateAuthorsTitlesType

My Account

LoginRegister

Statistics

Most Popular ItemsStatistics by CountryMost Popular Authors
Thumbnail

Multi-agent reinforcement learning and object detection asstructured prediction

Apprentissage par renforcement multi-agent et détection d'objets par prédiction structurée

Carion, Nicolas (2020), Multi-agent reinforcement learning and object detection asstructured prediction, doctoral thesis prepared under the supervision of Cazenave, Tristan; Usunier, Nicolas, Université Paris sciences et lettres

View/Open
2020UPSLD040.pdf (9.624Mb)
Type
Thèse
Date
2020-12-04
Metadata
Show full item record
Author(s)
Carion, Nicolas
Under the direction of
Cazenave, Tristan; Usunier, Nicolas
Abstract (FR)
Cette thèse explore l'utilisation de fonctions de perte structurées dans deux domaines distincts. Dans la première contribution, nous nous intéressons à l'apprentissage par renforcement multi-agent, dans le contexte d'environnements qui peuvent être séparés en plusieurs tâches faiblement dépendantes. On s'attache à trouver des politiques qui se généralisent à plus d'agents et de tâches que les scénarios d'entraînement, permettant ainsi d'augmenter la taille des problèmes qui peuvent être approchés. Notre solution affecte les agents aux tâches en résolvant un problème d'optimisation centralisé dont la fonction objectif est paramétrée par un réseau de neurones. On montre que l'expressivité du problème d'optimisation et celle du réseau de neurones influencent la capacité du modèle à généraliser, et qu'avec les bons choix, la politique peut généraliser à plus de 5 fois plus d'agents que pendant l'entraînement. Dans la seconde contribution, nous formulons la détection d'objets comme un problème de prédiction d'ensemble, et nous concevons un modèle dans cette optique. Notre solution utilise un réseau convolutionnel profond, comme souvent en vision par ordinateur, et un encodeur-décodeur de Transformer, une architecture qui a récemment permis d'importants progrès en traitement du langage. Remarquablement, notre solution n'incorpore que peu de biais inductif, et ne nécessite donc pas de composants spécifiques à la détection d'objets, tels que les ancres de détection. Avec un nombre de paramètres comparable, notre modèle égale la performance de modèles de référence, tels que Retinanet et Faster R-CNN sur le dataset de détection COCO. Pour finir, nous montrons que la méthode peut naturellement être étendue à la segmentation panoptique, où elle surpasse les approches concurrentes, démontrant ainsi sa généralité.
Abstract (EN)
This thesis explores the use of structured losses in two different domains. In the first contribution, we focus on multi-agent reinforcement learning (MARL), in environments that can be separated into several loosely coupled tasks. We set out to find policies that can generalize well to more agents and tasks than seen during training, effectively scaling up the size of problems that can betackled. Our solution assigns agents to tasks by approximately solving acentralized optimization problem whose objective function is parameterized by a neural network. We study how the expressivity of the optimization problem and that of the neural network influence the generalization capabilities of the model, and show that with the right choices, the policy can generalize to more than 5 times more agents than seen during training. In the second contribution we formulate object detection as a set prediction problem,and design a model that can effectively tackle this formulation. Our solution leverages a deep convolutional network, as is customary in computer vision, and a transformer encoder-decoder network, an architecture that has enabled significant progress innatural language processing. Crucially, our solution incorporates minimal inductive bias, thereby all eviating the need for hand-designed detection-specific components such as anchors or non-maximal suppression. With a comparable parameter budget, our model matches the performance of well-established and highly-optimized baselines such as Retinanet and Faster R-CNN on the challenging COCO detection dataset. Finally, we show that the method can be naturally extended to perform panoptic segmentation, where it out performs competing approaches, thus showing the versatility of the model.
Subjects / Keywords
Détection d’objets; Vision par ordinateur; Apprentissage par renforcement; Système multi-agent; Apprentissage profond; Object detection; Computer vision; Reinforcement learning; Multi-agent; Deep learning

Related items

Showing items related by title and author.

  • Thumbnail
    Argumentation in Multi-Agent Systems Second International Workshop, ArgMAS 2005, Revised Selected and Invited Papers 
    Rahwan, Iyad; Pavlos, Moraitis; Maudet, Nicolas; Parsons, Simon (2006) Ouvrage
  • Thumbnail
    Argumentation in Multi-Agent Systems: Context and Recent Developments 
    Maudet, Nicolas; Parsons, Simon; Rahwan, Iyad (2007) Communication / Conférence
  • Thumbnail
    Argumentation in multi-agent systems: Third international workshop, ArgMAS 2006, Hakodate, Japan, May 8, 2006: Revised Selected and Invited Papers 
    Rahwan, Iyad; Parsons, Simon; Maudet, Nicolas (2007) Ouvrage
  • Thumbnail
    Une approche multi-agents pour la composition de services Web fondée sur la confiance et les réseaux sociaux 
    Louati, Amine (2015-10) Thèse
  • Thumbnail
    Local Search, data structures and Monte Carlo Search for Multi-Objective Combinatorial Optimization Problems 
    Cornu, Marek (2017-12-18) Thèse
Dauphine PSL Bibliothèque logo
Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16
Phone: 01 44 05 40 94
Contact
Dauphine PSL logoEQUIS logoCreative Commons logo