Elagage des arbres de decision

Jean-Michel Vaudour

Mardi 21 Février 2006

Version imprimable
[Ignorer]

Bonjour,

Je souhaiterais mettre en oeuvre, dans une application d'analyse de données par arbre de décision, la méthode d'élagage d'arbres faisant appel à l'erreur statique (e) et à l'erreur propagée (be).

Cette méthode est illustrée par un exemple concret dans le document 'Arbres de décision - Notes de démonstration' de François Paradis, à l'adresse suivante : http://www.iro.umontreal.ca/~nie/IFT3330/demo-arbre.pdf
mais l'expression be(s) = ∑i pi E(si) avec E(s) = min(e(s), be(s))) avec E(s) = min(e(s), be(s)) m'est incompréhensible.

Je vous sollicite donc pour avoir le détail du calcul de l'erreur propagé 'be' dans l'exemple présenté en page 5 du document.

Je vous remercie pour votre aide précieuse.

Salutations

Serge BLANC

Jeudi 2 Mars 2006

Version imprimable
[Ignorer]

Bonjour,

La formule d'élégage donne un critère pour couper ou non une branche, ce qui veut dire rendre terminal le noeud considérer ou ajouter un nouveau critère de décision. Son esprit est : 'inutile de continuer à creuser si ça amène plus d'incertitude que d'information'. La formule propose donc simplement de comparer e(s), l'erreur calculée au niveau du noeud considérée à be(s) qui est la somme (pondérée) des erreurs des noeuds immédiatement consécutifs. La conclusion dans l'exemple que vous citez est qu'il faut se limiter au seul premier noeud car l'échantillon analysé est beaucoup trop petit !
Mais cette méthode n'est pas implémentée dans votre application d'analyse statistique, ni même documentée dans l'aide en ligne ?

Cordialement,

Serge Blanc