• xmlui.mirage2.page-structure.header.title
    • français
    • English
  • Aide
  • Connexion
  • Langue 
    • Français
    • English
Consulter le document 
  •   Accueil
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • Consulter le document
  •   Accueil
  • LAMSADE (UMR CNRS 7243)
  • LAMSADE : Publications
  • Consulter le document
JavaScript is disabled for your browser. Some features of this site may not work without it.

Afficher

Toute la baseCentres de recherche & CollectionsAnnée de publicationAuteurTitreTypeCette collectionAnnée de publicationAuteurTitreType

Mon compte

Connexion

Enregistrement

Statistiques

Documents les plus consultésStatistiques par paysAuteurs les plus consultés
Thumbnail - Request a copy

Sampling Methods in Genetic Programming Learners from Large Datasets: A Comparative Study

Hmida, Hmida; Ben Hamida, Sana; Borgi, Amel; Rukoz, Marta (2017), Sampling Methods in Genetic Programming Learners from Large Datasets: A Comparative Study, dans Angelov, Plamen; Manolopoulos, Yannis; Iliadis, Lazaros; Roy, Asim; Vellasco, Marley, Advances in Big Data : Proceedings of the 2nd INNS Conference on Big Data, October 23-25, 2016, Thessaloniki, Greece, Springer International Publishing : Cham, p. 50-60. 10.1007/978-3-319-47898-2_6

Type
Communication / Conférence
Date
2017
Titre du colloque
2nd INNS Conference on Big Data
Date du colloque
2016-10
Ville du colloque
Thessaloniki
Pays du colloque
Greece
Titre de l'ouvrage
Advances in Big Data : Proceedings of the 2nd INNS Conference on Big Data, October 23-25, 2016, Thessaloniki, Greece
Auteurs de l’ouvrage
Angelov, Plamen; Manolopoulos, Yannis; Iliadis, Lazaros; Roy, Asim; Vellasco, Marley
Éditeur
Springer International Publishing
Ville d’édition
Cham
Isbn
978-3-319-47897-5
Nombre de pages
348
Pages
50-60
Identifiant publication
10.1007/978-3-319-47898-2_6
Métadonnées
Afficher la notice complète
Auteur(s)
Hmida, Hmida
Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision [LAMSADE]
Ben Hamida, Sana cc
Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision [LAMSADE]
Borgi, Amel
Laboratoire d'Informatique, Programmation, Algorithmique et Heuristique [LIPAH]
Rukoz, Marta
Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision [LAMSADE]
Résumé (EN)
The amount of available data for data mining, knowledge discovery continues to grow very fast with the era of Big Data. Genetic Programming algorithms (GP), that are efficient machine learning techniques, are face up to a new challenge that is to deal with the mass of the provided data. Active Sampling, already used for Active Learning, might be a good solution to improve the Evolutionary Algorithms (EA) training from very big data sets. This paper investigates the adaptation of Topology Based Selection (TBS) to face massive learning datasets by means of Hierarchical Sampling. We propose to combine the Random Subset Selection (RSS) with the TBS to create the RSS-TBS method. Two variants are implemented, applied to solve the KDD intrusion detection problem. They are compared to the original RSS, TBS techniques. The experimental results show that the important computational cost generated by original TBS when applied to large datasets can be lightened with the Hierarchical Sampling.
Mots-clés
Sampling; machine learning; decision support systems; Big data

Publications associées

Affichage des éléments liés par titre et auteur.

  • Vignette de prévisualisation
    A new adaptive sampling approach for Genetic Programming 
    Hmida, Hmida; Ben Hamida, Sana; Borgi, Amel; Rukoz, Marta (2019) Communication / Conférence
  • Vignette de prévisualisation
    Adaptive sampling for active learning with genetic programming 
    Ben Hamida, Sana; Hmida, Hmida; Borgi, Amel; Rukoz, Marta (2019) Article accepté pour publication ou publié
  • Vignette de prévisualisation
    Scale Genetic Programming for large Data Sets: Case of Higgs Bosons Classification 
    Hmida, Hmida; Ben Hamida, Sana; Borgi, Amel; Rukoz, Marta (2018) Article accepté pour publication ou publié
  • Vignette de prévisualisation
    Genetic Programming over Spark for Higgs Boson Classification 
    Hmida, Hmida; Ben Hamida, Sana; Borgi, Amel; Rukoz, Marta (2019) Communication / Conférence
  • Vignette de prévisualisation
    Hierarchical Data Topology Based Selection for Large Scale Learning 
    Hmida, Hmida; Ben Hamida, Sana; Borgi, Amel; Rukoz, Marta (2016) Communication / Conférence
Dauphine PSL Bibliothèque logo
Place du Maréchal de Lattre de Tassigny 75775 Paris Cedex 16
Tél. : 01 44 05 40 94
Contact
Dauphine PSL logoEQUIS logoCreative Commons logo