Arbres de décision sur des données de type intervalle : évaluation et comparaison
Mballo, Chérif; Diday, Edwin (2005), Arbres de décision sur des données de type intervalle : évaluation et comparaison, in Pinson, Suzanne; Vincent, Nicole, Extraction et gestion des connaissances (EGC'2005), Actes des cinquièmes journées Extraction et Gestion des Connaissances, Paris, France, 18-21 janvier 2005, Capaduès Editions : Paris, p. 67-78
Type
Communication / ConférenceDate
2005Conference title
EGC 2005Conference date
2005-01Conference city
ParisConference country
FranceBook title
Extraction et gestion des connaissances (EGC'2005), Actes des cinquièmes journées Extraction et Gestion des Connaissances, Paris, France, 18-21 janvier 2005Book author
Pinson, Suzanne; Vincent, NicolePublisher
Capaduès Editions
Published in
Paris
ISBN
2-85428-677-4
Pages
67-78
Metadata
Show full item recordAbstract (FR)
Le critère de découpage binaire de Kolmogorov-Smirnov nécessite un ordre total des valeurs prises par les variables explicatives. Nous pouvons ordonner des intervalles fermés bornés de nombres réels de différentes façons. Notre contribution dans cet article consiste à évaluer et à comparer des arbres de décision obtenus sur des données de type intervalle à l’aide du critère de découpage binaire de Kolmogorov-Smirnov étendu à ce type de données (Mballo et al. 2004). Pour ce faire, nous axons notre attention sur le taux d’erreur mesuré sur l’échantillon de test. Pour estimer ce paramètre, nous divisons aléatoirement chaque base de données en deux parties égales en terme d’effectif (à un objet près) pour construire deux arbres. Ces deux arbres sont d’abord testés par un même échantillon puis par deux échantillons différents.Abstract (EN)
The binary splitting criterion of Kolmogorov-Smirnov (Friedman 1977) require a total order of the values of the explanatory variables. We can order closed and bounded intervals of real numbers in different ways (Diday et al. 2003). Our contribution in this paper consists of evaluating and comparing decision trees obtained on explanatory variables of interval type with the binary splitting criterion of Kolmogorov-Smirnov. This criterion have been extended to this type of variables (Mballo and al. 2004; Mballo and Diday 2004). We center our attention on the rate of misclassification obtained in the test set. To estimate this parameter, we divide randomly each data base in two equal parts in term of size (to within an object) to construct two decision trees. These two decision trees are first tested by a same test set and then by two different test sets.Subjects / Keywords
Numerical AnalysisRelated items
Showing items related by title and author.
-
Afonso, Filipe; Diday, Edwin (2005) Communication / Conférence
-
Billard, Lynne; Diday, Edwin (2006-01) Article accepté pour publication ou publié
-
Diday, Edwin; Douzal-Chouakria, Ahlame; Billard, Lynne (2011) Article accepté pour publication ou publié
-
Diday, Edwin; Groenen, P.J.F.; Winsberg, Suzanne; Rodriguez, O. (2006-01) Article accepté pour publication ou publié
-
Makosso Kallyth, Sun; Diday, Edwin (2012) Article accepté pour publication ou publié