Analyse en axes principaux de variables symboliques de type histogramme
Diday, Edwin; Makosso Kallyth, Sun (2010), Analyse en axes principaux de variables symboliques de type histogramme, 42èmes Journées de Statistique, 2010-05, Marseille, France
Type
Communication / ConférenceExternal document link
http://hal.archives-ouvertes.fr/inria-00494681/fr/Date
2010Conference title
42èmes Journées de StatistiqueConference date
2010-05Conference city
MarseilleConference country
FrancePages
6
Metadata
Show full item recordAbstract (FR)
Dans cet article nous proposons deux approches susceptibles d'effectuer une analyse en composantes principales ACP des variables symboliques de type histogramme. Ces approches sont applicables même quand le nombre de modalité des histogrammes diffère. On associe à chaque variable de type histogramme un ensemble de modalités qui ont chacune une fréquence relative lorsqu'on considère un individu. La première approche compte trois étapes. Elle procède d'abord par un codage des modalités des variables de type histogramme. L'objet de ce codage est d'attribuer des valeurs numériques appelées « scores » aux modalités des variables. A ce titre, on propose un codage paramétrique et un codage non paramétrique. La seconde étape consiste à effectuer une ACP des moyennes des histogrammes puis projette en éléments supplémentaires les sommets d'hypercubes induit par l'inégalité de Tchebychev. Dans la seconde approche, en plus des considérations précédentes, on utilise une transformation normalisatrice des données en guise de prétraitement des variables.Abstract (EN)
This paper deals with Principal Component Analysis (PCA) where the cells of the input data table are not only numerical values but histograms. Histograms are compositional data. PCA extended to such data table can be used when histogram variables don't have the same number of bins. In this paper, we propose at rst two ways for attributing scores to variables. Afterward, an ordinary PCA of mean of variables is achieved. Representation of dispersion of variable is done in using Tchebychev inequality. This inequality allows transforming histogram to interval. Then we project hypercube associated to each observation on principal axes. We also propose usage of angular trans- formation for removing drawbacks of histograms which are compositional data.Subjects / Keywords
inégalité de Tchebytchev; transformation angulaire; hypercube; variables de type histogrammeRelated items
Showing items related by title and author.
-
Makosso Kallyth, Sun (2010-11) Thèse
-
Makosso Kallyth, Sun; Diday, Edwin (2012) Article accepté pour publication ou publié
-
Emilion, Richard; Diday, Edwin; Goupil-Testu, Françoise (1995) Communication / Conférence
-
Diday, Edwin (2011) Chapitre d'ouvrage
-
Touati, Myriam; Goupil, Françoise; Diday, Edwin; Van der Veen, H. (2001) Communication / Conférence