Contributions à l'apprentissage en ligne dans les jeux stochastiques
Contributions on Online Learning in Stochastic Games
Baudin, Lucas (2023), Contributions à l'apprentissage en ligne dans les jeux stochastiques, doctoral thesis prepared under the supervision of Laraki, Rida; Vigeral, Guillaume; Gourvès, Laurent, Université Paris sciences et lettres
Author(s)
Baudin, LucasUnder the direction of
Laraki, Rida; Vigeral, Guillaume; Gourvès, LaurentAbstract (FR)
Cette thèse est consacrée à l'étude de la dynamique de systèmes multi-agents dans lesquels les agents apprennent via des algorithmes. Formellement, il s'agit d'apprentissage en ligne dans les jeux stochastiques. L'apprentissage en ligne est un champ des mathématiques et de l'informatique dans lequel on cherche à optimiser une fonction d'utilité ou de perte tout en interagissant avec l'environnement. À chaque étape, un agent choisit une action et observe ensuite ce qu'elle lui rapporte. Dans un jeu stochastique, les fonctions d'utilité des joueurs sont paramétrées par une variable d'état dont l'évolution peut être influencée par les joueurs. Cette thèse étudie des procédures d'apprentissage, certaines originales et d'autres déjà connues, qui peuvent être utilisées par des agents qui interagissent dans un environnement modélisé par un jeu stochastique. Nous analysons les dynamiques résultant de ces systèmes, par exemple en prouvant que le comportement moyen des agents converge vers un équilibre.Abstract (EN)
This thesis is dedicated to the study of the dynamics of multiagent systems with learning agents. This is formalized as online learning in stochastic games.Online learning is a field in mathematics and computer science that examines how to optimize a utility or loss function while interacting in an environment. It is typically supposed that interactions are a sequence of actions taken by an agent whose behavior is specified in algorithmic terms. In a stochastic game, utility functions are parameterized by a state variable evolution may be influenced by agents.This thesis studies new and existing learning procedures which can be used by agents to interact in a changing environment modeled as a stochastic game, and analyses the resulting dynamics, for instance via the time average behavior of the players.Subjects / Keywords
Théorie des jeux; Apprentissage en ligne; Jeux répétés; Jeux stochastiques; Game theory; Online learning; Repeated games; Stochastic gamesRelated items
Showing items related by title and author.
-
Hadikhanloo, Saeed (2018-01-29) Thèse
-
Takeda, Hirotoshi (2015-09) Thèse
-
Moreau, Ludovic (2012-09) Thèse
-
Dumitrescu, Roxana (2015-09) Thèse
-
Bertucci, Charles (2018-12-11) Thèse