Causal Populations Identification througth Hidden Distributions Estimation
Identification des populations causales par l'estimation de distributions cachées
dc.contributor.advisor | Atif, Jamal | |
dc.contributor.author | Beji, Celine | |
dc.date.accessioned | 2022-01-27T13:16:27Z | |
dc.date.available | 2022-01-27T13:16:27Z | |
dc.date.issued | 2021-10-28 | |
dc.identifier.uri | https://basepub.dauphine.psl.eu/handle/123456789/22478 | |
dc.description.abstractfr | Dans un cadre contrefactuel, cette thèse formalise l’inférence causale comme un problème d’estimation de densité. L’objectif est d’estimer la distribution de probabilité d’un mélange de quatre populations distinctes, définies par les résultats avec et sans traitement. Le problème fondamental est que les deux résultats ne sont pas observables simultanément. Deux modèles, introduisant des contraintes de causalité à partir de l’information partielle des résultats observés, sont proposés. La première approche, paramétrique, est basée sur un algorithme d’Espérance-Maximisation. Les paramètres des distributions des populations causales sont estimés itérativement en maximisant la vraisemblance, tout en ajoutant un apriori sur les probabilités a posteriori dans une étape intermédiaire. La seconde approche non-paramétrique utilise une architecture d’Auto-Encodeur améliorée par un apriori. Ce dernier se présente sous la forme d’un masque dans la couche intermédiaire du réseau. Des expérimentations sont menées sur des ensembles de données synthétiques et réelles pour prouver l’efficacité de ces approches. Quelques extensions sont également proposées. | fr |
dc.language.iso | en | |
dc.subject | Inférence causale | fr |
dc.subject | Résultat contrefactuel | fr |
dc.subject | Effet de traitement individuel | fr |
dc.subject | Contrainte de causalité | fr |
dc.subject | Espace latent | fr |
dc.subject | Auto-Encodeur | fr |
dc.subject | Espérance-Maximisation | fr |
dc.subject | Causal inference | en |
dc.subject | Counterfactual outcome | en |
dc.subject | Individual Treatment Effect | |
dc.subject | Uplift | en |
dc.subject | Causal constraint | en |
dc.subject | Latent space | en |
dc.subject | Auto-Encoder | en |
dc.subject | Expectation-Maximization | en |
dc.subject.ddc | 003 | |
dc.title | Causal Populations Identification througth Hidden Distributions Estimation | en |
dc.title | Identification des populations causales par l'estimation de distributions cachées | fr |
dc.type | Thèse | |
dc.contributor.editoruniversityother | Université Paris sciences et lettres | |
dc.description.abstracten | In a counterfactual framework, this thesis formalizes the causal inference as a density estimation problem. The aim is to estimate the probability distribution of a mixture of four separate populations, defined by the outcomes with and without treatment. The fundamental problem is that the two outcomes are not simultaneously observable. Two models, leveraging causal constraints built from the partial information of the observed outcomes, are proposed. The first parametric approach is based on an Expectation-Maximization algorithm. The parameters of the causal populations distributions are iteratively estimated by maximizing the likelihood, while adding a prior on the posterior probabilities in an intermediate step. The second non-parametric approach uses an Auto-Encoder architecture enhanced by a prior. The prior is materialized as a mask which is introduced in the intermediate layer of the network. Experiments are conduced on synthetic and real-life datasets to prove the efficiency of these approaches and some extensions are proposed. | en |
dc.identifier.theseid | 2021UPSLD004 | |
dc.subject.ddclabel | Recherche opérationnelle | |
hal.author.function | aut |