|
Forums, dernières contributions
Quels algorithmes predictif utiliser ?
Bonjour,
J'ai eu des cas similaires à regler.
Vous parlez de variable 'Temps' : Vu votre description des données, j'imagine plutot une variable 'Année' et 12 variables 'mois'. Année prend les valeurs '2006', '2007' ... et les 12 variables mois sont des variables binaires (0 / 1). Vous avez ainsi plusieurs varaibles pour décrire le temps.
Dans ce premier cas, vous pourrez trés certainement appliquer une regression lineaire multiple : la variable année vous donnera la tendance, les mois la saisonnailité.
J'ai trés souvent obtenu de bon résultat avec cette methode, coefficient de détermination a l'appui.
Dans cette methode, je laisse votre imagination rajouter de nouvelles variables en plus des mois/années pour améliorer la précision de votre prévision .... (Nb de jours ouvrables dans le mois par exemple ? elle s'obtient avec n'importe quel calendrier)
Bonjour,
Je n'ai pas compris toutes tes questions cependant, j'ai quelques pistes pour toi.
Tu peux utiliser une regression linéaire afin de prédire ta variable Y à partir du temps. Cependant, ton modèle ne sera pas performant. Pour prédire l'évolution d'une variable continue en fonction du temps, il est préferable d'utiliser les processus AR ou MA (voir ARIMA) qui permettent ce type de prévision avec une plus grande éfficacité (prévision de vente, de stock, etc...), ces méthodes sont utilisable sur SAS, SPSS, R... Si tu as une fonction périodique, il faut savoir capter la périodicité. Tu dois alors tester la saisonnalité (test de Fisher) et désaisonnaliser ta variable Y en fonction de la période avant de construire ton modèle afin de ne modéliser que la tendance.
Concernant le modèle logistique, je n'ai pas compris toute la question. Mais si tu veux utiliser tes variables Z1 et Z2, tu dois les découper par modalité pour les intégrer dans ton modèle . En fait, tu en fais des variables dummies qui renvoie 1 si verte en printemps et 0 sinon etc...
En te rappelant que les modèles de régression nécéssitent une grande quantité de données pour être éfficace (ce sont des modèles stochastiques).
Tu trouveras facilement de la doc sur internet qui décrivent les méthodes dont je t'ai parlé.
Bonne chance
|