Actualités : analyse de données, Business Intelligence, Data Science, Big Data
Forums, dernières contributions

Quels algorithmes predictif utiliser ?

 Arnaud
Lundi 19 Novembre 2007

Version imprimable
[Ignorer]
Bonjour,

J’ai besoin d’aide pour un algorithme dans lequel je dois résoudre le problème suivant :
« Compte tenu de la valeur de mes variables Y et de leur évolution historique, quelle sera la valeur de ces variables Y au temps X. X étant une date dans le futur». Les variables Y peuvent être de type différents, par exemple :
*Numériques, exemple fictif :
Y = 1 – 5 – 10 – 20 – 25 – 40 - … ?
X = Janvier – Février – Mars – Avril – Mai – Juin - …
*Catégorielles, exemple fictif:
Z = Rouge – Vert – Rouge – Vert – Rouge – Rouge - Rouge …. ?
X2 = Janvier – Février – Mars – Avril – Mai – Juin - …

Pour l’instant j’ai simplement imaginé ceci :
- Dans le cas ou la variable a prédire est continue, appliquer une régression linéaire.
- Dans le cas ou la variable a prédire est catégorielle (binaire ou pas), alors appliquer une régression logistique.

Voici mes questions :
1 - Est-ce que effectivement la régression peut s'appliquer quand il y a une seule variable explicative (ici c’est la variable « temps ») ?
2 - Quand la variable Y est numérique, mais que le phénomène a identifier n’est pas linéaire (par exemple une fonction périodique qui oscille dans le temps), comment reconnaître ce phénomène et que faut il appliquer comme algorithme pour prédire l’évolution de la variable Y ?
3 – Une régression logistique est-elle faisable quand les variables Z sont catégorielles mais que leur évolution historique est vraiment différente (par exemple imaginons des variables Z1 «vertes» tous les printemps et «rouges» tous les hivers, et d’autres variables Z2 «rouges» pendant quelques mois puis toujours «vertes» jusqu'à l’infini) ?
4 – J’ai aussi entendu parler d’un certain algorithme de « Monté Carlo », qui je viens de le voir sert a calculer une valeur numérique. Mais quelle est le fonctionnement de cette méthode pour la prédiction de variables (y a-t-il un rapport avec les techniques de régression ?), et est-ce que ceci peut s’appliquer dans mon cas ?

J’espère que ma demande n’est pas trop abstraite, car je suis moi même un peu perdu sur la démarche à suivre. C’est pourquoi j’aimerai des conseils pour ne pas partir sur un mauvais chemin des le départ.

Merci d’avance de votre aide.
 Stephane Oberlechner
Mercredi 21 Novembre 2007

Version imprimable
[Ignorer]
Bonjour,

J'ai eu des cas similaires à regler.
Vous parlez de variable 'Temps' : Vu votre description des données, j'imagine plutot une variable 'Année' et 12 variables 'mois'. Année prend les valeurs '2006', '2007' ... et les 12 variables mois sont des variables binaires (0 / 1). Vous avez ainsi plusieurs varaibles pour décrire le temps.

Dans ce premier cas, vous pourrez trés certainement appliquer une regression lineaire multiple : la variable année vous donnera la tendance, les mois la saisonnailité.

J'ai trés souvent obtenu de bon résultat avec cette methode, coefficient de détermination a l'appui.

Dans cette methode, je laisse votre imagination rajouter de nouvelles variables en plus des mois/années pour améliorer la précision de votre prévision .... (Nb de jours ouvrables dans le mois par exemple ? elle s'obtient avec n'importe quel calendrier)


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store