Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Les nouveaux métiers du datamining


Rédigé par Thierry Vallaud le 7 Décembre 2005

Par Thierry Théron Directeur Général du cabinet de recrutement N&T Entreprises et Thierry Vallaud Directeur des Etudes d’Arvato information services

Le datamining est une discipline en pleine expansion notamment en raison de l’explosion du volume des données dans les entreprises.
Cette activité vise à rentabiliser la collecte de ces données en les transformant en informations directement utilisables par l’entreprise. Ce besoin apparaît de plus en plus urgent avec la croissance exponentielle des entrepôts de données.
Le cabinet N&T Entreprises intervient depuis 1998 dans l’univers des études et du conseil ; il est un des rares spécialistes de cette discipline.
Arvato information services, Société du groupe Bertelsmann est spécialisée dans l’analyse et la gestion des données marketing.
Les deux partenaires se proposent de faire un point sur les expertises nécessaires au datamining.



Les nouveaux métiers du datamining
Les profils :

Deux familles de métiers alimentent la profession du datamining.
- les statisticiens
- les informaticiens

En fonction de ces deux grands courants on trouve des libellés / fonctions sensiblement différents même si en définitive, ils sont censés accomplir la même tâche.

Le statisticien analyste junior vs le technicien en informatique décisionnel junior
Le statisticien analyste senior vs le technicien en informatique décisionnel senior

Sous la dépendance d’un directeur/responsable du datamining ou des études

Cette double origine peut accroître la richesse du service, sa productivité, sa réactivité scientifique et technique.
Ultérieurement, en fonction de l’activité, les libellés des fonctions se subdivisent en se spécialisant. On discernera :
- Les hommes de la connaissance client
- Les analystes marketing
- Les analystes du risque (métiers de la banque, de la finance, de l’assurance…)
- Les ingénieurs en économétrie

NB : l’intitulé « Ingénieur » indique une prédominance de science et technique informatique dans la fonction.
Au delà des libellés une unité de service en datamining est en général composée d’analystes juniors à parité avec des analystes seniors sous la responsabilité d'un chef de groupe dès que l'effectif atteint 3 ou 4 personnes.
On observe qu'il est souvent plus profitable de responsabiliser ou de spécialiser sur des projets de petites équipes de 2 à 4 personnes, quitte à les multiplier en fonction de la démande ou du développement.
Avec l’accroissement de la taille du service, les fonctions vont se spécialiser à mesure que les exigences de la production induisent la subdivision des activités :
- préparation des données
- modélisation
- tests et contrôles qualité
- rédaction des rapports

Ce sont les familles de tâches respectivement confiées à des techniciens à qui il va être demandé de se spécialiser.
Les plus grands services vont dissocier :
- l’utilisation courante des modèles de datamining dans une cellule production
- la mise au point de modèles dans une cellule « R&D »
- la commercialisation

La compétence :

La statistique, l’informatique décisionnelle exigent au minimum un diplôme à BAC + 3
Plus le niveau de la formation est élevé plus l’évolution sera rapide.
L’expérience dans les postes accroît l’étendue et la profondeur des connaissances opérationnelles et donc, la réactivité et le potentiel, partant, la valeur du candidat. Les candidats les plus recherchés sont d’ailleurs ceux qui ont acquis leur expertise dans les sociétés de conseil du secteur.
Les profils mixtes dits « double compétence » sont naturellement les plus prisés : Ils apportent souvent une contribution prête à l’emploi, directement transposable ou transformable en prestation commerciale.
- statistique + marketing
- statistique + informatique
- statistique + informatique + marketing (le mouton à cinq pattes pour les sociétés de conseil mais pas rarissime dans le monde du logiciel.)

Les résultats offerts par le datamining sont directement utilisés pour la prise de décisions stratégiques. Une bonne connaissance pratique du marketing études est un facteur de succès supplémentaire voire décisif.
Les postes d’encadrement, compte tenu du caractère complexe du processus supervisé nécessitent trois dispositions :
- un niveau de formation universitaire permettant de conduire ou de diriger des activités de recherche : master, DEA, doctorat
- une expérience du management (management des hommes comme des projets)
- des aptitudes commerciales, qu’il s’agisse de développer le portefeuille client, d’accroître l’activité par client, ou plus couramment, de défendre son produit, aussi bien en valeur absolue qu'en termes de bénéfice client. Ces dispositions et avec elles la conscience des enjeux liés à la relation client manquent parfois aux techniciens des métiers de la statistiques et informatiques.

Le commercial « datamining » est le plus souvent un scientifique ou technicien devenu marchand. Il doit cumuler des connaissances statistiques assez poussées, une aptitude importante à la rédaction, et évidement avoir le sens de la vente. Ces trois compétences ne sont pas toujours réunies sur une seule tête ! Les élus sont rares … et chers. Avantage, ils restera à long terme dans cette profession où ils trouvent un quotidien gratifiant, les clients renvoyant logiquement à l’ingénieur commercial (ou consultant) une image positive de lui même et de sa discipline. Il acceptera intelligemment les challenges techniques et commerciaux successifs qui lui permettront de repousser ses propres limites, accroissant par là même son « employabilité » future.
Bien souvent les fonctions de management d’un service de datamining amène à la fonction commerciale ne serait-ce que via l’assistance aux vendeurs. Fréquemment, les dataminers parvenus à un certain niveau d’expertise quittent la technique pour un poste commercial en datamining, parfois au sein de la même entreprise. Les intéressés savent qu’ils ne reviendront vraisemblablement pas en arrière, cela dope leur engagement et leur détermination.

Les outils :

Souvent le poste va être lié au choix de l’outil, ceci est particulièrement vrai pour les postes « les plus juniors » et moins pour les postes les plus seniors, quoi que…
Deux outils phares se partagent le marché du datamining :
- Clémentine de SPSS, leader des solutions de datamining les plus vendues dans le monde
- SAS Entreprise Miner de SAS
- d’autres outils existent : IBM Miner, Knowledge Seeker de Angoss, KXEN…on les rencontre moins souvent.

Pour être efficace, le dataminer doit avoir été formé sur la solution, c’est à dire l’outil. A défaut, il faut prévoir une phase d’apprentissage en contexte réel allant de 6 mois à 1 an. La connaissance de l’outil conditionne directement le potentiel opérationnel à court terme du candidat. Les SSII généralistes proposent des collaborateurs formés à l’ensemble des solutions mais l’expérience montre qu’il est difficile de passer d’un outil à un autre si on prétend le connaître en profondeur.

Les évolutions :

En moyenne le changement de poste s’effectue entre la 2ème et la 3ème année d’expérience. L’évolution est assez rapide au début évidemment.
Le changement de société permet bien souvent d’optimiser une progression tant de poste que de la rémunération.
Une carrière commence en général dans les sociétés de conseil pour aller ensuite vers des postes chez l’annonceur.

Les écoles :

Actuellement les formations aux datamining sont encore peu présentes en France mais se développent rapidement. En revanche des formations de statistiques classiques peuvent aussi mener au datamining, quelques exemples de référence :
Les écoles d’ingénieurs :
- ENSAI
- ENSAE
- ISUP
A ces trois écoles spécifiquement orientées vers les statistiques et qu développe une approche poussée du datamining, nous retrouvons un certain nombre d’écoles qui intègrent dans leurs enseignements des modules portant sur le datamining comme l’ENPC par exemple


Filières universitaires :

Licences professionnelles :

- Licence Professionnelle Datamining - Université de Marne-la-Vallée
- Licence de Statistique et Informatique Décisionnelle – Toulouse 3

Master professionnel :

- Master Sciences de l’information, de la modélisation et des systèmes - Toulouse 1
- Master Statistique & Économétrie - Toulouse 1
- Master Modélisation et Analyse Statistique de l'Information - Vannes UBS
- Master Ingénierie de la statistique - Versailles/CNAM
- Master Statistique et Traitement de Données - Clermont Ferrand II
- Master Production et gestion de l'Information Statistique - Grenoble 2
- Master Ingénierie Statistique et numérique – Lille 1
- Master Statistique et Systèmes d'information Socio-économiques – Lyon 2
- Master Méthodes Statistiques et numériques - - Université de Marne-la-Vallée
- Master Techniques Statistiques et Informatique - Paris 2
- Master Méthodes Statistiques pour la Finance et l'Industrie - Reims
- Master Statistique pour l'entreprise – Renne 2
- Master Statistique et Informatique décisionnelle – Toulouse 3
- Master Ingénierie Economique & Statistique appliquée – Evry
- Master Mathématiques et Informatique Appliquées aux Sciences Humaines et Sociales – Lille 3
- Master Techniques d’Information et de Décision dans l’Entreprise – Paris 1
- Master Mathématiques de la Décision – Paris 9
- Master Ingénierie des Données en Sciences Sociales et Economie - Université de Savoie

Quelques formations à l’étranger :
*
- Master en datamining - CCSU USA
- Master Data management et datamining - l’UCL Belgique

La rémunération :

Junior BAC +5 : entre 25 K€ et 30 K€ brut/an
Confirmé (2 à 5 ans) : entre 30 K€ et 45 K€ brut/an
Senior (5 ans et plus) : entre 45 K€ et 70 K€ brut/an (et plus)
Directeur d’études & de Clientèle : entre 55 K€ et 105 K€ brut/an

La détention d’une compétence « métier » comme celle du domaine bancaire peut accélérer les progressions avec une appréciation très significative (20% et plus) des niveaux de rémunération.
Le datamining, métier très spécialisé, est parfois considéré comme un peu ingrat dans le secteur des études de marché car on y étudie et y valorise la plupart du temps des données que l’on a pas recueilli soi-même. Mais c’est aussi pour cette raison que les rémunérations sont plus importantes que dans les autres secteurs plus classiques des études.

Les difficultés liées au recrutement :

Il est difficile de trouver des candidats directement formés et opérationnels à la sortie de l’école. La qualité et les durées des premiers stages font la différence.
Par ailleurs pour les seniors et les dirigeants, l’approche directe par cabinet est la plus efficace. Il est difficile d’en faire l’économie. Très sollicités les candidats sont à la fois sensibles aux projets sur lesquels ils vont devoir travailler, à la qualité humaine de l’entreprise qui les reçoit (l’ambiance de travail), ainsi qu’à la progression de la rémunération lors d’un changement (entre 15% et 30% selon les profils). L’approche directe ne dispense pas l’entreprise de communiquer régulièrement sur ses projets, sur ses besoins, sur les opportunités de carrière que son développement peut représenter pour des candidats de valeur.
Il est plus délicat et plus cher d’attirer des candidats exigeants vers une entreprise qui n’a pas l’image d’un employeur dynamique. Et il est surprenant de constater à quel point l’image d’employeur de certaines firmes est en retard ou en décalage sur leur image de fournisseur, d’opérateur scientifique, industriel ou commercial.

Pour conclure :

Le volume des données concernées par le datamining double chaque année. Tous les agents qui les stockent et à qui ce stockage coûte cher ont un besoin urgent d’outils décisionnels et de datamining.
Les métiers du datamining sont à mi-chemin entre plusieurs compétences clefs qui les rendent un peu particuliers dans le métier des études. Si l’on prend comme point de comparaison le développement informatique, les études de marché (ad hoc, Panels) il faut prévoir que le recrutement s’orientera à terme vers des doubles ou triples compétences : des personnes capables en effet de communiquer avec les utilisateurs, de concevoir des approches méthodologiques et scientifiques et même dans certains cas, de les mettre en œuvre. On observera l’arrivée de profils plus généralistes, de consultants fort potentiel et culturellement plus faciles à recruter.
En attendant, les fonctions restent relativement segmentées et spécialisées. Le recrutement requiert donc une approche des candidats par des chargés de recherches compétents et crédibles auprès de ces professionnels.




Commentaires
Du plus récent au plus ancien | Du plus ancien au plus récent

17.Posté par Fred le 06/02/2007 14:53
L'EISTI est une école d'ingénieur proposant une spécialisation en décisionnel en dernière année ainsi qu'un Mastère en Informatique Décisionnelle.
http://www.eisti.fr/dep/inge/optdsi.dim?session=2732078
http://ms.eisti.fr/sommaire.php3?id_rubrique=10

16.Posté par Butin le 12/01/2007 10:07
Outre la trilogie SAS Enterprise Miner - SPSS Clementine - SPAD Datamining - KXEN ayant une approche statistique plus singulière - quelques solutions d'éditeurs français peuvent être utilement explorées : STATISTICA DATA MINER (de Statsoft), et DATALAB (de Complex Systems). Approfondir régulièrement sa pratique professionnelle avec des modules de formation intensive courte (certificats d'éditeurs notamment).

15.Posté par Lordthias le 05/01/2007 15:27
Ne pas oublier le Marter Recherche ECD (Extraction des Connaissances à partir des données) à la pointe de tout se qui peut se faire en recherche dans le domaine du datamining.
Bon article.

14.Posté par caillet le 09/10/2006 13:25
Je suis assez étonné au niveau des salaires annoncées: de 25 à 30 ke pour un junior je trouve ca faible. Perso, j'ai commencé à 33ke après le dess Ingénierie Statistique du Cnam. Et, je pense que si on sort de grandes écoles (type ensae), ca peut monter à plus.

13.Posté par caillet le 09/10/2006 13:20
Perso, j'ai fais le dess Ingénierie statistique au cnam de Saporta: très bon dess.

12.Posté par Michel L le 17/09/2006 23:38
Toujours dans les filières de formation : la Licence pro Data Mining du département STID (Statistique et Traitement Informatique des Données) à l'IUT de Paris5, depuis 1970 : LP "Décision et Traitement de l’Information – Data Mining"

site :http://www.iut.univ-paris5.fr/dept/stid/

11.Posté par Sonia le 21/08/2006 16:20
Bonjour,
Je vois que vous ne faites pas allusion au master recherche en économétrie de lille 1 (MISEG).Est ce que ce master pourrait me permettre d'accèder au poste de dataminner ou vaudrait-il mieux que j'envisage de faire un master professionnel?
Merci de me répondre.

10.Posté par tutu le 18/08/2006 16:12
ne pas oublier le cnam bien sur,qui propose une multitude de formations en statistique de bac+3 à bac+5

9.Posté par fati le 09/08/2006 15:16
bonjour,
excellent article sur le dataminning,
je souhaite bien savoir si je peux avec une licence professionelle bac+3 spécialité econométrie acceder à un poste dataminner
merci de me repondre

8.Posté par winbald le 28/07/2006 06:45
Bonjour, article trés intéressant que j'ai d'ailleurs publié sur mon blog.
Bon voilà, je suis accepté dans deux masters:
Finance et économétrie - paris 2
Ingénieurie Economique - Bordeaux 4
Lequel choisir???
Lequel serait plus proches des masters cités plus haut?
Voici leurs programmes respectifs
http://beagle.u-bordeaux4.fr/masterIE/#master2r
http://www.u-paris2.fr/html/formations/m2_recherche_pro/m2rp_finance_et_econometrie.pdf
merci.

1 2 3


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store