|
Forums, dernières contributions
Elagage des arbres de decision
Bonjour,
Je souhaiterais mettre en oeuvre, dans une application d'analyse de données par arbre de décision, la méthode d'élagage d'arbres faisant appel à l'erreur statique (e) et à l'erreur propagée (be).
Cette méthode est illustrée par un exemple concret dans le document 'Arbres de décision - Notes de démonstration' de François Paradis, à l'adresse suivante : http://www.iro.umontreal.ca/~nie/IFT3330/demo-arbre.pdf
mais l'expression be(s) = ∑i pi E(si) avec E(s) = min(e(s), be(s))) avec E(s) = min(e(s), be(s)) m'est incompréhensible.
Je vous sollicite donc pour avoir le détail du calcul de l'erreur propagé 'be' dans l'exemple présenté en page 5 du document.
Je vous remercie pour votre aide précieuse.
Salutations
Bonjour,
La formule d'élégage donne un critère pour couper ou non une branche, ce qui veut dire rendre terminal le noeud considérer ou ajouter un nouveau critère de décision. Son esprit est : 'inutile de continuer à creuser si ça amène plus d'incertitude que d'information'. La formule propose donc simplement de comparer e(s), l'erreur calculée au niveau du noeud considérée à be(s) qui est la somme (pondérée) des erreurs des noeuds immédiatement consécutifs. La conclusion dans l'exemple que vous citez est qu'il faut se limiter au seul premier noeud car l'échantillon analysé est beaucoup trop petit !
Mais cette méthode n'est pas implémentée dans votre application d'analyse statistique, ni même documentée dans l'aide en ligne ?
Cordialement,
Serge Blanc
|