Agence universitaire de la Francophonie

Infothèque francophone
RESSOURCES EN LIGNE ET ACTUALITÉS
SCIENTIFIQUES FRANCOPHONES


5820 - Etude du modèle d'apprentissage Probablement approximativement correct (PAC) : application aux méthodes d'agrégation

Thèse, mémoire de diplôme

Description bibliographique

Auteur :
Gavin, Gérald (Université Louis Lumière, Lyon 2. Faculté de Sciences économiques et de Gestion. France) ; Zighed, Abdelkader (dir.) (Université Lumière, Lyon 2. ERIC. Equipe de recherche en ingénierie des connaissances. France)
Éditeur :
Université Lumière, Lyon 2. Division ERAD. Edition, reproduction, archivage et diffusion du document. France
Page source :
Les thèses électroniques de Lyon 2, http://theses.univ-lyon2.fr
Langue :
français
Diplôme :
thèse, informatique, 2001/01/05

Description du contenu

Spécialité :
Electronique, informatique et télécommunications - Théories, méthodes - Théorie des systèmes, automates
Mots clés :
apprentissage supervisé ; modèle PAC ; théorie de Vapnik ; data-mining ; agrégation ; boosting
Table des matières :
I - Fondements théoriques de l'apprentissage PAC
1. Modèle d'apprentissage PAC
2. Résultats de convergence en classification
3. De la regression à la classification...
II - Datamining et méthodes d'agrégation à base de votes
4 Méthodes d'agrégation à base de votes
5 Adaboost et arbres d'induction
A - Inégalité de Hoeffding
B - Démonstrations de Lemme
Résumé :
Le cadre de cette thèse est la théorie de l'apprentissage avec application au data-mining. Au cours des années 1990, de nouveaux principes d'induction sont apparus : les méthodes d'agrégation à base de vote. Les exemples les plus connus sont certainement le Bagging, initié par Breiman, ainsi qu'Adaboost, initié par Freud, reposant sur de solides fondations théoriques inspirées du modèle d'apprentissage Probablement Approximativement Correct (PAC) et plus précisément des travaux de Vapnik. Cette thèse comporte ainsi deux parties distinctes mais complémentaires l'une de l'autre. La première consiste en une étude approfondie de l'apprentissage PAC et de la théorie de Vapnik. Cette théorie permet de contrôler l'erreur réelle à partir de l'erreur empirique, pour tout algorithme d'apprentissage, sans faire aucune hypothèse à traiter. Il propose de majorer le nombre d'exemples requis pour que l'erreur empirique soit un bon estimateur de l'erreur réelle au vu d'un critère de précision et un de fiabilité. L'auteur propose un résultat permettant d'améliorer cette constante. La seconde partie de la thèse concerne l'étude des algorithmes à base de vote. L'auteur présente quelques exemples représentatifs dont il compare ensuite les justifications. Dans un second temps il se propose d'adapter ces méthodes à deux problématiques du data-mining.

Accès à la ressource

gratuit
Copyright Gérald Gavin et Université Lumière, Lyon 2 - 2001. Ce document est protégé en vertu de la loi du droit d'auteur.
Format :
PDF
Taille du fichier : plus de 5 Mo
URL de référence :
http://theses.univ-lyon2.fr/bases/detail_theses.php?titre=383
Autres URLs :
http://theses.univ-lyon2.fr/Theses2001/gavin_g/these.pdf

Notice mise en ligne le 28/11/2003