|
Forums, dernières contributions
Quels algorithmes predictif utiliser ?
Bonjour,
J’ai besoin d’aide pour un algorithme dans lequel je dois résoudre le problème suivant :
« Compte tenu de la valeur de mes variables Y et de leur évolution historique, quelle sera la valeur de ces variables Y au temps X. X étant une date dans le futur». Les variables Y peuvent être de type différents, par exemple :
*Numériques, exemple fictif :
Y = 1 – 5 – 10 – 20 – 25 – 40 - … ?
X = Janvier – Février – Mars – Avril – Mai – Juin - …
*Catégorielles, exemple fictif:
Z = Rouge – Vert – Rouge – Vert – Rouge – Rouge - Rouge …. ?
X2 = Janvier – Février – Mars – Avril – Mai – Juin - …
Pour l’instant j’ai simplement imaginé ceci :
- Dans le cas ou la variable a prédire est continue, appliquer une régression linéaire.
- Dans le cas ou la variable a prédire est catégorielle (binaire ou pas), alors appliquer une régression logistique.
Voici mes questions :
1 - Est-ce que effectivement la régression peut s'appliquer quand il y a une seule variable explicative (ici c’est la variable « temps ») ?
2 - Quand la variable Y est numérique, mais que le phénomène a identifier n’est pas linéaire (par exemple une fonction périodique qui oscille dans le temps), comment reconnaître ce phénomène et que faut il appliquer comme algorithme pour prédire l’évolution de la variable Y ?
3 – Une régression logistique est-elle faisable quand les variables Z sont catégorielles mais que leur évolution historique est vraiment différente (par exemple imaginons des variables Z1 «vertes» tous les printemps et «rouges» tous les hivers, et d’autres variables Z2 «rouges» pendant quelques mois puis toujours «vertes» jusqu'à l’infini) ?
4 – J’ai aussi entendu parler d’un certain algorithme de « Monté Carlo », qui je viens de le voir sert a calculer une valeur numérique. Mais quelle est le fonctionnement de cette méthode pour la prédiction de variables (y a-t-il un rapport avec les techniques de régression ?), et est-ce que ceci peut s’appliquer dans mon cas ?
J’espère que ma demande n’est pas trop abstraite, car je suis moi même un peu perdu sur la démarche à suivre. C’est pourquoi j’aimerai des conseils pour ne pas partir sur un mauvais chemin des le départ.
Merci d’avance de votre aide.
Bonjour,
J'ai eu des cas similaires à regler.
Vous parlez de variable 'Temps' : Vu votre description des données, j'imagine plutot une variable 'Année' et 12 variables 'mois'. Année prend les valeurs '2006', '2007' ... et les 12 variables mois sont des variables binaires (0 / 1). Vous avez ainsi plusieurs varaibles pour décrire le temps.
Dans ce premier cas, vous pourrez trés certainement appliquer une regression lineaire multiple : la variable année vous donnera la tendance, les mois la saisonnailité.
J'ai trés souvent obtenu de bon résultat avec cette methode, coefficient de détermination a l'appui.
Dans cette methode, je laisse votre imagination rajouter de nouvelles variables en plus des mois/années pour améliorer la précision de votre prévision .... (Nb de jours ouvrables dans le mois par exemple ? elle s'obtient avec n'importe quel calendrier)
|