• xmlui.mirage2.page-structure.header.title
    • français
    • English
  • Help
  • Login
  • Language 
    • Français
    • English
View Item 
  •   BIRD Home
  • CEREMADE (UMR CNRS 7534)
  • CEREMADE : Thèses
  • View Item
  •   BIRD Home
  • CEREMADE (UMR CNRS 7534)
  • CEREMADE : Thèses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

BIRDResearch centres & CollectionsBy Issue DateAuthorsTitlesTypeThis CollectionBy Issue DateAuthorsTitlesType

My Account

LoginRegister

Statistics

Most Popular ItemsStatistics by CountryMost Popular Authors
Thumbnail - No thumbnail

Arbres de décisions symboliques, outils de validations et d'aide à l'interprétation

Symbolic decision trees, tools for validation and interpretation assistance

Seck, Djamal (2012), Arbres de décisions symboliques, outils de validations et d'aide à l'interprétation, doctoral thesis prepared under the supervision of Diday, Edwin, Université Paris Dauphine, 147 p.

Thesis file
Intranet Access
Type
Thèse
Date
2012-12
Pages
147
Metadata
Show full item record
Author(s)
Seck, Djamal
Under the direction of
Diday, Edwin
Abstract (FR)
Nous proposons dans cette thèse la méthode STREE de construction d'arbres de décision avec des données symboliques. Ce type de données permet de caractériser des individus de niveau supérieur qui peuvent être des classes ou catégories d’individus ou des concepts au sens des treillis de Galois. Les valeurs des variables, appelées variables symboliques, peuvent être des ensembles, des intervalles ou des histogrammes. Le critère de partitionnement récursif est une combinaison d'un critère par rapport aux variables explicatives et d'un critère par rapport à la variable à expliquer. Le premier critère est la variation de la variance des variables explicatives. Quand il est appliqué seul, STREE correspond à une méthode descendante de classification non supervisée. Le second critère permet de construire un arbre de décision. Il s'agit de la variation de l'indice de Gini si la variable à expliquer est nominale et de la variation de la variance si la variable à expliquer est continue ou bien est une variable symbolique. Les données classiques sont un cas particulier de données symboliques sur lesquelles STREE peut aussi obtenir de bons résultats. Il en ressort de bonnes performances sur plusieurs jeux de données UCI par rapport à des méthodes classiques de Data Mining telles que CART, C4.5, Naive Bayes, KNN, MLP et SVM. STREE permet également la construction d'ensembles d'arbres de décision symboliques soit par bagging soit par boosting. L'utilisation de tels ensembles a pour but de pallier les insuffisances liées aux arbres de décisions eux-mêmes et d'obtenir une décision finale qui est en principe plus fiable que celle obtenue à partir d'un arbre unique.
Abstract (EN)
In this thesis, we propose the STREE methodology for the construction of decision trees with symbolic data. This data type allows us to characterize individuals of higher levels which may be classes or categories of individuals or concepts within the meaning of the Galois lattice. The values of the variables, called symbolic variables, may be sets, intervals or histograms. The criterion of recursive partitioning is a combination of a criterion related to the explanatory variables and a criterion related to the dependant variable. The first criterion is the variation of the variance of the explanatory variables. When it is applied alone, STREE acts as a top-down clustering methodology. The second criterion enables us to build a decision tree. This criteron is expressed as the variation of the Gini index if the dependant variable is nominal, and as the variation of the variance if thedependant variable is continuous or is a symbolic variable. Conventional data are a special case of symbolic data on which STREE can also get good results. It has performed well on multiple sets of UCI data compared to conventional methodologies of Data Mining such as CART, C4.5, Naive Bayes, KNN, MLP and SVM. The STREE methodology also allows for the construction of ensembles of symbolic decision trees either by bagging or by boosting. The use of such ensembles is designed to overcome shortcomings related to the decisions trees themselves and to obtain a finaldecision that is in principle more reliable than that obtained from a single tree.
Subjects / Keywords
Arbre de décision; Données symboliques; Variable à expliquer; Variables explicatives; Indice de Gini; Variance; Élagage; Courbe ROC; Bagging; Boosting; Decision tree; Symbolic data; Dependant variable; Explanatory variables; Gini index; Variance; Pruning; ROC curve; Bagging; Boosting

Related items

Showing items related by title and author.

  • Thumbnail
    Une approche d'aide multicritère à la décision pour l'évaluation du confort dans les trains : construction d'un modèle d'évaluation 
    Mammeri, Mohamed (2013-09) Thèse
  • Thumbnail
    Proposition d’un outil d’aide à la décision adapté aux contraintes et aux enjeux d’un soutien informatique aux consultations médicales coutumières 
    Richard, Antoine (2021-04-06) Thèse
  • Thumbnail
    Classification and Regression Trees on Aggregate Data Modeling: An Application in Acute Myocardial Infarction 
    Quantin, Catherine; Billard, Lynne; Touati, Myriam; Andreu, N.; Cotin, Y.; Zeller, Manfred; Afonso, Filipe; Battaglia, G.; Seck, Djamal; Le Teuff, G.; Diday, Edwin (2011) Article accepté pour publication ou publié
  • Thumbnail
    Un outil graphique interactif d'aide à l'interprétation de résultats d'analyse de données : FGPLOT 
    Goupil-Testu, Françoise (1995) Article accepté pour publication ou publié
  • Thumbnail
    Incitation et contrôle en univers multi-institutionnel : nature et rôle des outils d’aide à la décision Application à l’amélioration de la qualité de service dans les transports urbains 
    Sommerlatt, Isabelle (2002) Communication / Conférence
Dauphine PSL Bibliothèque logo
Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16
Phone: 01 44 05 40 94
Contact
Dauphine PSL logoEQUIS logoCreative Commons logo