Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Les nouveaux métiers du datamining


Rédigé par Thierry Vallaud le 7 Décembre 2005

Par Thierry Théron Directeur Général du cabinet de recrutement N&T Entreprises et Thierry Vallaud Directeur des Etudes d’Arvato information services

Le datamining est une discipline en pleine expansion notamment en raison de l’explosion du volume des données dans les entreprises.
Cette activité vise à rentabiliser la collecte de ces données en les transformant en informations directement utilisables par l’entreprise. Ce besoin apparaît de plus en plus urgent avec la croissance exponentielle des entrepôts de données.
Le cabinet N&T Entreprises intervient depuis 1998 dans l’univers des études et du conseil ; il est un des rares spécialistes de cette discipline.
Arvato information services, Société du groupe Bertelsmann est spécialisée dans l’analyse et la gestion des données marketing.
Les deux partenaires se proposent de faire un point sur les expertises nécessaires au datamining.



Les nouveaux métiers du datamining
Les profils :

Deux familles de métiers alimentent la profession du datamining.
- les statisticiens
- les informaticiens

En fonction de ces deux grands courants on trouve des libellés / fonctions sensiblement différents même si en définitive, ils sont censés accomplir la même tâche.

Le statisticien analyste junior vs le technicien en informatique décisionnel junior
Le statisticien analyste senior vs le technicien en informatique décisionnel senior

Sous la dépendance d’un directeur/responsable du datamining ou des études

Cette double origine peut accroître la richesse du service, sa productivité, sa réactivité scientifique et technique.
Ultérieurement, en fonction de l’activité, les libellés des fonctions se subdivisent en se spécialisant. On discernera :
- Les hommes de la connaissance client
- Les analystes marketing
- Les analystes du risque (métiers de la banque, de la finance, de l’assurance…)
- Les ingénieurs en économétrie

NB : l’intitulé « Ingénieur » indique une prédominance de science et technique informatique dans la fonction.
Au delà des libellés une unité de service en datamining est en général composée d’analystes juniors à parité avec des analystes seniors sous la responsabilité d'un chef de groupe dès que l'effectif atteint 3 ou 4 personnes.
On observe qu'il est souvent plus profitable de responsabiliser ou de spécialiser sur des projets de petites équipes de 2 à 4 personnes, quitte à les multiplier en fonction de la démande ou du développement.
Avec l’accroissement de la taille du service, les fonctions vont se spécialiser à mesure que les exigences de la production induisent la subdivision des activités :
- préparation des données
- modélisation
- tests et contrôles qualité
- rédaction des rapports

Ce sont les familles de tâches respectivement confiées à des techniciens à qui il va être demandé de se spécialiser.
Les plus grands services vont dissocier :
- l’utilisation courante des modèles de datamining dans une cellule production
- la mise au point de modèles dans une cellule « R&D »
- la commercialisation

La compétence :

La statistique, l’informatique décisionnelle exigent au minimum un diplôme à BAC + 3
Plus le niveau de la formation est élevé plus l’évolution sera rapide.
L’expérience dans les postes accroît l’étendue et la profondeur des connaissances opérationnelles et donc, la réactivité et le potentiel, partant, la valeur du candidat. Les candidats les plus recherchés sont d’ailleurs ceux qui ont acquis leur expertise dans les sociétés de conseil du secteur.
Les profils mixtes dits « double compétence » sont naturellement les plus prisés : Ils apportent souvent une contribution prête à l’emploi, directement transposable ou transformable en prestation commerciale.
- statistique + marketing
- statistique + informatique
- statistique + informatique + marketing (le mouton à cinq pattes pour les sociétés de conseil mais pas rarissime dans le monde du logiciel.)

Les résultats offerts par le datamining sont directement utilisés pour la prise de décisions stratégiques. Une bonne connaissance pratique du marketing études est un facteur de succès supplémentaire voire décisif.
Les postes d’encadrement, compte tenu du caractère complexe du processus supervisé nécessitent trois dispositions :
- un niveau de formation universitaire permettant de conduire ou de diriger des activités de recherche : master, DEA, doctorat
- une expérience du management (management des hommes comme des projets)
- des aptitudes commerciales, qu’il s’agisse de développer le portefeuille client, d’accroître l’activité par client, ou plus couramment, de défendre son produit, aussi bien en valeur absolue qu'en termes de bénéfice client. Ces dispositions et avec elles la conscience des enjeux liés à la relation client manquent parfois aux techniciens des métiers de la statistiques et informatiques.

Le commercial « datamining » est le plus souvent un scientifique ou technicien devenu marchand. Il doit cumuler des connaissances statistiques assez poussées, une aptitude importante à la rédaction, et évidement avoir le sens de la vente. Ces trois compétences ne sont pas toujours réunies sur une seule tête ! Les élus sont rares … et chers. Avantage, ils restera à long terme dans cette profession où ils trouvent un quotidien gratifiant, les clients renvoyant logiquement à l’ingénieur commercial (ou consultant) une image positive de lui même et de sa discipline. Il acceptera intelligemment les challenges techniques et commerciaux successifs qui lui permettront de repousser ses propres limites, accroissant par là même son « employabilité » future.
Bien souvent les fonctions de management d’un service de datamining amène à la fonction commerciale ne serait-ce que via l’assistance aux vendeurs. Fréquemment, les dataminers parvenus à un certain niveau d’expertise quittent la technique pour un poste commercial en datamining, parfois au sein de la même entreprise. Les intéressés savent qu’ils ne reviendront vraisemblablement pas en arrière, cela dope leur engagement et leur détermination.

Les outils :

Souvent le poste va être lié au choix de l’outil, ceci est particulièrement vrai pour les postes « les plus juniors » et moins pour les postes les plus seniors, quoi que…
Deux outils phares se partagent le marché du datamining :
- Clémentine de SPSS, leader des solutions de datamining les plus vendues dans le monde
- SAS Entreprise Miner de SAS
- d’autres outils existent : IBM Miner, Knowledge Seeker de Angoss, KXEN…on les rencontre moins souvent.

Pour être efficace, le dataminer doit avoir été formé sur la solution, c’est à dire l’outil. A défaut, il faut prévoir une phase d’apprentissage en contexte réel allant de 6 mois à 1 an. La connaissance de l’outil conditionne directement le potentiel opérationnel à court terme du candidat. Les SSII généralistes proposent des collaborateurs formés à l’ensemble des solutions mais l’expérience montre qu’il est difficile de passer d’un outil à un autre si on prétend le connaître en profondeur.

Les évolutions :

En moyenne le changement de poste s’effectue entre la 2ème et la 3ème année d’expérience. L’évolution est assez rapide au début évidemment.
Le changement de société permet bien souvent d’optimiser une progression tant de poste que de la rémunération.
Une carrière commence en général dans les sociétés de conseil pour aller ensuite vers des postes chez l’annonceur.

Les écoles :

Actuellement les formations aux datamining sont encore peu présentes en France mais se développent rapidement. En revanche des formations de statistiques classiques peuvent aussi mener au datamining, quelques exemples de référence :
Les écoles d’ingénieurs :
- ENSAI
- ENSAE
- ISUP
A ces trois écoles spécifiquement orientées vers les statistiques et qu développe une approche poussée du datamining, nous retrouvons un certain nombre d’écoles qui intègrent dans leurs enseignements des modules portant sur le datamining comme l’ENPC par exemple


Filières universitaires :

Licences professionnelles :

- Licence Professionnelle Datamining - Université de Marne-la-Vallée
- Licence de Statistique et Informatique Décisionnelle – Toulouse 3

Master professionnel :

- Master Sciences de l’information, de la modélisation et des systèmes - Toulouse 1
- Master Statistique & Économétrie - Toulouse 1
- Master Modélisation et Analyse Statistique de l'Information - Vannes UBS
- Master Ingénierie de la statistique - Versailles/CNAM
- Master Statistique et Traitement de Données - Clermont Ferrand II
- Master Production et gestion de l'Information Statistique - Grenoble 2
- Master Ingénierie Statistique et numérique – Lille 1
- Master Statistique et Systèmes d'information Socio-économiques – Lyon 2
- Master Méthodes Statistiques et numériques - - Université de Marne-la-Vallée
- Master Techniques Statistiques et Informatique - Paris 2
- Master Méthodes Statistiques pour la Finance et l'Industrie - Reims
- Master Statistique pour l'entreprise – Renne 2
- Master Statistique et Informatique décisionnelle – Toulouse 3
- Master Ingénierie Economique & Statistique appliquée – Evry
- Master Mathématiques et Informatique Appliquées aux Sciences Humaines et Sociales – Lille 3
- Master Techniques d’Information et de Décision dans l’Entreprise – Paris 1
- Master Mathématiques de la Décision – Paris 9
- Master Ingénierie des Données en Sciences Sociales et Economie - Université de Savoie

Quelques formations à l’étranger :
*
- Master en datamining - CCSU USA
- Master Data management et datamining - l’UCL Belgique

La rémunération :

Junior BAC +5 : entre 25 K€ et 30 K€ brut/an
Confirmé (2 à 5 ans) : entre 30 K€ et 45 K€ brut/an
Senior (5 ans et plus) : entre 45 K€ et 70 K€ brut/an (et plus)
Directeur d’études & de Clientèle : entre 55 K€ et 105 K€ brut/an

La détention d’une compétence « métier » comme celle du domaine bancaire peut accélérer les progressions avec une appréciation très significative (20% et plus) des niveaux de rémunération.
Le datamining, métier très spécialisé, est parfois considéré comme un peu ingrat dans le secteur des études de marché car on y étudie et y valorise la plupart du temps des données que l’on a pas recueilli soi-même. Mais c’est aussi pour cette raison que les rémunérations sont plus importantes que dans les autres secteurs plus classiques des études.

Les difficultés liées au recrutement :

Il est difficile de trouver des candidats directement formés et opérationnels à la sortie de l’école. La qualité et les durées des premiers stages font la différence.
Par ailleurs pour les seniors et les dirigeants, l’approche directe par cabinet est la plus efficace. Il est difficile d’en faire l’économie. Très sollicités les candidats sont à la fois sensibles aux projets sur lesquels ils vont devoir travailler, à la qualité humaine de l’entreprise qui les reçoit (l’ambiance de travail), ainsi qu’à la progression de la rémunération lors d’un changement (entre 15% et 30% selon les profils). L’approche directe ne dispense pas l’entreprise de communiquer régulièrement sur ses projets, sur ses besoins, sur les opportunités de carrière que son développement peut représenter pour des candidats de valeur.
Il est plus délicat et plus cher d’attirer des candidats exigeants vers une entreprise qui n’a pas l’image d’un employeur dynamique. Et il est surprenant de constater à quel point l’image d’employeur de certaines firmes est en retard ou en décalage sur leur image de fournisseur, d’opérateur scientifique, industriel ou commercial.

Pour conclure :

Le volume des données concernées par le datamining double chaque année. Tous les agents qui les stockent et à qui ce stockage coûte cher ont un besoin urgent d’outils décisionnels et de datamining.
Les métiers du datamining sont à mi-chemin entre plusieurs compétences clefs qui les rendent un peu particuliers dans le métier des études. Si l’on prend comme point de comparaison le développement informatique, les études de marché (ad hoc, Panels) il faut prévoir que le recrutement s’orientera à terme vers des doubles ou triples compétences : des personnes capables en effet de communiquer avec les utilisateurs, de concevoir des approches méthodologiques et scientifiques et même dans certains cas, de les mettre en œuvre. On observera l’arrivée de profils plus généralistes, de consultants fort potentiel et culturellement plus faciles à recruter.
En attendant, les fonctions restent relativement segmentées et spécialisées. Le recrutement requiert donc une approche des candidats par des chargés de recherches compétents et crédibles auprès de ces professionnels.




Commentaires
Du plus récent au plus ancien | Du plus ancien au plus récent

7.Posté par Joel Da Costa le 18/07/2006 11:07
Bonjour,

Ayant suivi la formation MIAGE à Dauphine, celle-ci n'est peut être pas autant orientée décisionnel que Polytech Nantes ou Polytech Lille, il s'agit d'un formation très orientée Gestion des entreprises et Informatique.

Cependant une part important du cursus est dédié aux mathématiques, à la recherche opérationnelle, aux statistiques, à l'analyse de données (avec notamment des cours sur SPAD et SODAS), et aux bases de données.

C'est donc un cursus un peu plus généraliste, mais qui prépare très bien aux métiers du décisionnels et du datamining, avec en bonus un très bon bagage en terme de gestion des entreprise.

Joël Da Costa

6.Posté par Loïc le 17/07/2006 12:57
De même Polytech'Nantes propose un cursus de 3 ans en informatique décisionnelle.La part de l'enseignement du datamining y est très important.
A vérifier, mais il semble que ce soit la seule école en France à proposer un cursus sur 3 ans en BI (ce n'est pas une option de dernière année mais bien 3 ans de formation)

5.Posté par NicolasF le 15/07/2006 17:44
Polytech Lille (ex Eudil) propose une formation d'ingénieur Génie informatique et statistique. Je m'étonne qu'elle ne soit pas citée dans la liste des écoles d'ingénieur. Souhaitant me diriger vers lesmétiers du datamining après un DUT informatique, j'hésite entre cette formation à Polytech Lille et un MIAGE (suivi si je le peux d'un Master ISF) à Dauphine, étant accepté dans les 2 cursus. Que me conseilleriez-vous?

4.Posté par Patrice KERMORVANT le 05/04/2006 18:05
La connaissance de certains logiels est requise dans les offres de stages et d'emploi que nous recevons et diffusons (environ 200 offres d"emploi / an et 140 propositions de stages/an).Même si vous ne pouvez pas citer tous les outils dans votre article, il me semblerait raisonnable de citer SPAD dont la connaissance est régulièrement demandée. Même si sa diffusion n'est pas mondiale, il semble répondre à une certaine demande dans des entreprises s'initiant au datamining. Et il est assez souvent enseigné dans les formations universitaires, en complément d'outils comme SAS entreprise Miner ou équivalent.

3.Posté par Patrice KERMORVANT le 04/04/2006 16:04
statistique + informatique + marketing : le mouton à cinq pattes ?La Licence Professionnelle "Statistique Décisionnelle en Marketing" à l'IUT de Vannes (Université de Bretagne-Sud) en forment une vingtaine par an.....N'oubliez pas pas non plus la filière Vannetaise avec un DUT STID, 3 Licences Pro et son Master Modélisation et Analyse Statistique de l'Information....Enfin, l'Association des Anciens Etudiants en Statistique de Vannes (AESV) diffuse près de de 200 offres d'emploi dans le domaine du traitement de l'information à ses nombreux diplômés (Bac+2 à Bac+5) :www.aesv.net

2.Posté par Bernard Guy Biboum le 28/03/2006 16:56
Votre article est vraiment excellent. Je voudrais tout juste ajouter qu'il aussi la filière "Systèmes d'Information et d'Aide à la Décision" généralement proposée par l'ESSEC et l'HEC qui permet d'acquérir des aptitudes en matière de statistiques et informatique, prédisposant dès lors ceux qui la suivent.

1.Posté par Martial le 14/02/2006 17:03
je souhaiterais simplement ajouter à la liste des formations universitaires l'excellent Master mention Modélisation mathématique,statistique et informatique de Bordeaux2 : www.sm.u-bordeaux2.fr ;)

1 2 3


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store