Actualités : analyse de données, Business Intelligence, Data Science, Big Data
Forums, dernières contributions

Quels algorithmes predictif utiliser ?

 Arnaud
Lundi 19 Novembre 2007

Version imprimable
[Ignorer]
Bonjour,

J’ai besoin d’aide pour un algorithme dans lequel je dois résoudre le problème suivant :
« Compte tenu de la valeur de mes variables Y et de leur évolution historique, quelle sera la valeur de ces variables Y au temps X. X étant une date dans le futur». Les variables Y peuvent être de type différents, par exemple :
*Numériques, exemple fictif :
Y = 1 – 5 – 10 – 20 – 25 – 40 - … ?
X = Janvier – Février – Mars – Avril – Mai – Juin - …
*Catégorielles, exemple fictif:
Z = Rouge – Vert – Rouge – Vert – Rouge – Rouge - Rouge …. ?
X2 = Janvier – Février – Mars – Avril – Mai – Juin - …

Pour l’instant j’ai simplement imaginé ceci :
- Dans le cas ou la variable a prédire est continue, appliquer une régression linéaire.
- Dans le cas ou la variable a prédire est catégorielle (binaire ou pas), alors appliquer une régression logistique.

Voici mes questions :
1 - Est-ce que effectivement la régression peut s'appliquer quand il y a une seule variable explicative (ici c’est la variable « temps ») ?
2 - Quand la variable Y est numérique, mais que le phénomène a identifier n’est pas linéaire (par exemple une fonction périodique qui oscille dans le temps), comment reconnaître ce phénomène et que faut il appliquer comme algorithme pour prédire l’évolution de la variable Y ?
3 – Une régression logistique est-elle faisable quand les variables Z sont catégorielles mais que leur évolution historique est vraiment différente (par exemple imaginons des variables Z1 «vertes» tous les printemps et «rouges» tous les hivers, et d’autres variables Z2 «rouges» pendant quelques mois puis toujours «vertes» jusqu'à l’infini) ?
4 – J’ai aussi entendu parler d’un certain algorithme de « Monté Carlo », qui je viens de le voir sert a calculer une valeur numérique. Mais quelle est le fonctionnement de cette méthode pour la prédiction de variables (y a-t-il un rapport avec les techniques de régression ?), et est-ce que ceci peut s’appliquer dans mon cas ?

J’espère que ma demande n’est pas trop abstraite, car je suis moi même un peu perdu sur la démarche à suivre. C’est pourquoi j’aimerai des conseils pour ne pas partir sur un mauvais chemin des le départ.

Merci d’avance de votre aide.
 Mohamed Azzi
Jeudi 22 Novembre 2007

Version imprimable
[Ignorer]
Bonjour,

Je n'ai pas compris toutes tes questions cependant, j'ai quelques pistes pour toi.

Tu peux utiliser une regression linéaire afin de prédire ta variable Y à partir du temps. Cependant, ton modèle ne sera pas performant. Pour prédire l'évolution d'une variable continue en fonction du temps, il est préferable d'utiliser les processus AR ou MA (voir ARIMA) qui permettent ce type de prévision avec une plus grande éfficacité (prévision de vente, de stock, etc...), ces méthodes sont utilisable sur SAS, SPSS, R... Si tu as une fonction périodique, il faut savoir capter la périodicité. Tu dois alors tester la saisonnalité (test de Fisher) et désaisonnaliser ta variable Y en fonction de la période avant de construire ton modèle afin de ne modéliser que la tendance.

Concernant le modèle logistique, je n'ai pas compris toute la question. Mais si tu veux utiliser tes variables Z1 et Z2, tu dois les découper par modalité pour les intégrer dans ton modèle . En fait, tu en fais des variables dummies qui renvoie 1 si verte en printemps et 0 sinon etc...

En te rappelant que les modèles de régression nécéssitent une grande quantité de données pour être éfficace (ce sont des modèles stochastiques).

Tu trouveras facilement de la doc sur internet qui décrivent les méthodes dont je t'ai parlé.

Bonne chance



Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store