Tous ceux qui envisagent la fouille de données à un certain moment partagent une même caractéristique, ils s’interrogent sur de nombreux points et notamment sur l’intérêt d’une telle approche. Vu que la majorité d’entre nous apprend grâce aux exemples, la plupart de ces interrogations portent sur ce que font les autres spécialistes de la fouille de données : quels problèmes résolvent-ils à l’aide des technologies de fouille de données ? Comment s’y prennent-ils ? Combien de temps leur faut-il ? En retirent-ils quelque chose ? Dans le but d’aider les entreprises qui étudient la valeur de la fouille de données, Teradata a mis sur pied un laboratoire de fouille de données à San Diego en Californie. Il offre aux entreprises le cadre, les conseils et les outils pour tester la fouille de données et réaliser des projets pilote avant de mettre en œuvre leurs propres solutions.
Les premiers adeptes de cette approche avec lesquels le laboratoire Teradata a travaillé, se sont focalisés sur une ou deux questions spécifiques relatives au comportement de leurs clients. Ils souhaitaient quantifier certains aspects du comportement de leurs clients et en particulier pouvoir les catégoriser. Ainsi, une grande banque internationale voulait contrôler les coûts générés par ses clients lorsqu’ils utilisaient les distributeurs automatiques d’autres banques. La société voulait obtenir une réponse pour chacune des quatre questions suivantes : Qu’est-ce qui constitue une utilisation excessive par le client des distributeurs automatiques de la concurrence ? Quels sont les clients qui génèrent des coûts excessifs par l’utilisation des distributeurs automatiques de la concurrence ? Quelle est la valeur qu’ils représentent pour notre banque ? A quoi devons-nous prêter attention lorsque nous utilisons ces résultats ?
La première découverte fut que 10% des clients de la banque généraient 90% des coûts des distributeurs automatiques. Cette constatation aurait peut-être pu être faite à l’aide de moyens traditionnels. Cependant, grâce à la fouille de données, nous avons pu mettre en évidence le fait que sur les 10% des clients qui généraient les coûts, 80% étaient des clients de faible valeur. Ensuite, nous avons pu, à l’aide de plusieurs techniques de fouille de données permettant de prendre en compte de multiples variables, comprendre la valeur potentielle de chacun des clients de faible valeur et quantifier le concept d’ « utilisation excessive ». La fouille de données a également permis de répondre à la question logique suivante que devait se poser la banque : fallait-il revoir le service offert à ces 80% de clients de faible valeur ? Pour répondre à cette question, nous avons étudié les tendances comportementales. Environ 30% de ces clients de faible valeur étaient des clients à fort potentiel, à savoir : des étudiants. Ce n’était certes pas une découverte surprenante mais elle aurait été difficilement réalisable sans les techniques d’analyse de multiples variables et les données détaillées.
La découverte la plus intéressante réalisée dans le cadre de la résolution du problème du coût des distributeurs automatiques fut qu’un concurrent ciblait les campus universitaires en vue d’y installer de nouveaux distributeurs automatiques. Aucune autre banque ne développait d’actions sur les campus et celle-ci jouissait d’une présence quasiment exclusive. Grâce à cette expérience en fouille de données, la banque pu répondre à ses questions initiales. Mais ce qui est encore plus important, c’est qu’elle fut en mesure de découvrir la stratégie d’un concurrent.
L’intérêt suscité par la fouille de données varie en fonction des secteurs. Le laboratoire Teradata a travaillé avec des banques, des distributeurs, des fabricants de produits de grande consommation, des sociétés de télécommunication, des sociétés de transport et depuis peu, des compagnies d’assurances. Il semblerait que le marketing et les finances marquent le plus d’intérêt pour la fouille de données. Les spécialistes du marketing doivent maîtriser le retour sur investissement de leurs opérations et pour cela, ils cherchent à cibler les campagnes sur les clients les plus susceptibles d’acheter un produit ou un service particulier. Les départements financiers sont intéressés par la possibilité d’aligner le coût des services sur les revenus (ou les revenus potentiels) tirés d’un client ou d’un segment de clients. Parmi les principales priorités de ces groupes, citons la compréhension et la réduction de l’attrition.
Par exemple, une des études réalisée est un cas classique de modélisation des réponses marketing. Une entreprise de télécommunication obtenait un taux de retour de 0,5% sur ses campagnes marketing. Elle souhaitait découvrir les clients les plus susceptibles d’acheter des services groupés. Cette entreprise envisageait le développement de capacités en matière de fouille de données mais elle voulait d’abord voir comment la fouille de données fonctionnait. Avec l’aide du laboratoire, un modèle de propension à l’achat a été créé afin d’aider l’entreprise à prévoir les services qui, une fois groupés, seraient susceptibles d’être achetés par des clients particuliers. Le déploiement du modèle dans un territoire de vente test s’est traduit par une augmentation d’un facteur 10 des ventes de services groupés. Ces résultats démontrèrent l’exactitude des prévisions du modèle et convainquirent l’entreprise de l’efficacité de la fouille de données. Les résultats de ce test restreint furent tels que l’entreprise a depuis lors appliqué le modèle au niveau national. L’entreprise a également suffisamment appris sur les procédures de fouille de données que le laboratoire Teradata utilise et a suffisamment développé ses aptitudes au niveau des outils d’analyse qu’elle développe aujourd’hui ses modèles de manière indépendante.
Ces quelques exemples n’épuisant pas le sujet, vous pouvez utilement consulter le lien suivant :
http://www.teradata.com/t/page/44097/index.html