ID3.doc

Les algorithmes d'apprentissage par arbres de décision sont efficaces,
disponibles dans la plupart des environnements de fouille de données. Ils
constituent ...

Part of the document


[pic][pic][pic]
[pic]
|Chapitre 2 |
|Apprentissage automatique : les arbres de décision |
| |
. Les arbres de décision
. Exemple introductif et préliminaires
. Généralités sur l'apprentissage des arbres de décision
. Un premier algorithme : CART (Breiman et al. [BFOS84])
. Un deuxième algorithme : C4.5 (Quinlan 93 [Qui93])
. Conclusion Pour certains domaines d'application, il est essentiel de produire des
procédures de classification compréhensibles par l'utilisateur. C'est en
particulier le cas pour l'aide au diagnostic médical où le médecin doit
pouvoir interpréter les raisons du diagnostic. Les arbres de décision
répondent à cette contrainte car ils représentent graphiquement un ensemble
de règles et sont aisément interprétables. Pour les arbres de grande
taille, la procédure globale peut être difficile à appréhender, cependant,
la classification d'un élément particulier est toujours compréhensible. Les
algorithmes d'apprentissage par arbres de décision sont efficaces,
disponibles dans la plupart des environnements de fouille de données. Ils
constituent l'objet de ce chapitre. |2.1 |
|Les arbres de décision |
| | Exemple 7 La population est constituée d'un ensemble de patients. Il y a
deux classes : malade et bien portant. Les descriptions sont faites avec
les deux attributs : Température qui est un attribut à valeurs décimales et
gorge irritée qui est un attribut logique. On considère l'arbre de décision
de la figure ??. [pic]
[pic] Figure 2.1 : Un exemple d'arbre de décision.
[pic]
Un arbre de décision est un arbre au sens informatique du terme. On
rappelle que les noeuds d'un arbre sont repérés par des positions qui sont
des mots sur {1,...,p}*, où p est l'arité maximale des noeuds. Si on note
le mot vide par ?, les positions pour l'arbre de la figure ?? sont :
. ? étiquetée par le test Température