Retour à la page précédente
Réservation : Forêts aléatoires : sélection de variables et bornes de risque.
Description : Dans un premier temps, nous présentons une méthode de sélection de variables basée sur l'algorithme des forêts aléatoires. Les forêts aléatoires, introduites par Léo Breiman en 2001, sont une technique statistique très utilisée dans des problèmes pratiques aussi bien en régression qu'en classification. En plus d'être très performantes en prédiction, les forêts aléatoires calculent un indice d'importance des variables. Basée sur cet indice d'importance, notre procédure de sélection de variables cherche à traiter deux problèmes distincts : trouver toutes les variables reliées à la variable réponse (interprétation) ; et trouver un ensemble de variables suffisant pour prédire la variable réponse (prédiction). Après avoir décrit en détail la procédure proposée, nous l'illustrons sur des données d'IRMf (Imagerie à Résonance Magnétique fonctionnelle). Ces données sont de très grande dimension (le nombre de variables est gigantesque) et les deux problèmes de sélection ci-dessus se posent naturellement.
Dans un deuxième temps, nous présentons un résultat de consistance des forêts purement aléatoires, établi par Gérard Biau, Luc Devroye et Gabor Lugosi. Enfin, nous détaillons un résultat nouveau de réduction de variance d'une forêt purement aléatoire comparée à un arbre purement aléatoire.
Equipe organisatrice : Probabilités et Statistiques
Jury (Thèse / HDR) :
Orateur : Robin Genuer
Titre (Thèse / HDR) :
Université Orateur : Université Paris-Sud
URL Orateur : http://www.math.u-psud.fr/~genuer/
Ressource : Laboratoire J.A.Dieudonné - Salle de conférence
Date de début : 11:30 - jeudi 10 décembre 2009
Durée : 1 heure(s)
Date de fin : 12:30 - jeudi 10 décembre 2009
Type : Séminaire
Réservation effectuée par  :
Dernière mise à jour : 17:20 - jeudi 07 février 2013
Cette réservation est attachée à une périodicité Help
Type de périodicité :chaque semaine
Jour pour la périodicité :jeudi
Début de la réservation : 11:30 - jeudi 10 décembre 2009
Durée :1 heure(s)
Date de fin de périodicité :vendredi 26 mars 2010