Thierry Vallaud, Socio Logiciels
Avant l‘analyse quantitative qui sera dévoilée prochainement, les premiers enseignements dégagés confirment ma précédente prise de position.
Définition du métier Data Scientist : une hybridation entre des métiers déjà connus
La plupart des répondants citent le métier de Data Miner en tant que dénomination précédente du métier de Data Scientist. Les termes de « Statisticien », « Chargé d’études statistiques » ou d’ « Analyste Statisticien » apparaissent également. L’un d’eux précise que cela diffère en fonction du pays. Aux Etats Unis, il s’agirait plutôt « d’informaticiens intelligents au solide bagage scientifique » alors qu’en France les profils seraient plutôt des Statisticiens sortis de formations scientifiques de type Grandes Ecoles.
Des compétences multiples aux socles de connaissance déjà existants
Le socle du Data Scientist est bien pour tous les répondants les statistiques. La notion de compétences multiples est très présente dans les réponses des experts et plusieurs avis concordent sur le fait que le Data Scientist doit disposer d’une triple compétence opérationnelle, à savoir :
• la maitrise des techniques du Data Mining et des Statistiques,
• une appétence aux technologies et aux outils informatiques des bases de données
• un savoir-faire métier dans le domaine d’application des données étudiées (le Marketing est principalement cité).
Un répondant s’interroge sur la notion du Data Scientist omniscient, qui cumulerait à lui seul les trois compétences et suggère que la clé du succès résidera certainement davantage dans le fait de faire collaborer managers, statisticiens et informaticiens.
Des missions précédemment dévolues dans le passé aux data miners
Au quotidien, la répartition des tâches incombant à la fonction de Data Scientist est très variable selon les secteurs, les enjeux, et le niveau d’expérience. Néanmoins, les grandes étapes qui structurent un projet sont citées (toutes ou en partie) par la plupart des répondants :
• Comprendre la problématique métier, les enjeux et les objectifs de l’analyse. Traduire un problème « business » en problème mathématiques/statistiques ;
• Obtenir des données adéquates : trouver les sources de données pertinentes, faire des recommandations sur les bases de données à consolider, modifier, rapatrier, externaliser, internaliser, concevoir des datamarts, voire des entrepôts de données (data warehouses) ;
• Evaluer la qualité et la richesse des données, les analyser et en restituer les résultats. Les intégrer dans le système d’information cible.
Certains répondants font remarquer que la plupart de ces missions étaient déjà dévolues au data miners.
Pas encore de formations dédiées
Les formations préconisées par les répondants sont principalement les écoles d’ingénieurs spécialisées en statistique (de type ENSAI, ENSAE, Télécom), les grandes écoles plus généralistes, de type Centrale, Polytechnique ou la formation continue de la CNAM. Dans tous les cas, le cursus doit associer les statistiques et le Data Mining à l’informatique. Certains confirment que le monde universitaire semble pour l’instant peu adapté (les outils récents n’y sont pas enseignés) et le déconseillent. D’autres préconisent même une formation plus pratique que théorique avec l’autoformation ou un apprentissage du Data Mining « sur le terrain ».
Un avenir prometteur, à condition de miser sur la complémentarité des métiers
Les retours des répondants quant à l’évolution de la fonction de Data Scientist sont plutôt positifs et porteurs d’espoirs. Un expert précise même que « Google annonce que c'est LE métier n°1 d'avenir ». En effet, la plupart des interrogés pensent que la fonction sera « de plus en plus reconnue », « de plus en plus demandée ». Les vrais Data Scientists seront d’ailleurs appelés à exercer des fonctions stratégiques au sein des entreprises. La demande étant croissante, l'écart entre demande et offre va continuer de se creuser et certaines fonctions vont nécessairement évoluer vers la fonction de Data Scientist. En pratique, les Data Scientists vont devoir être plus polyvalents dans les technologies et les outils maitrisés. Ils vont également devoir faire preuve de plus de pédagogie et accroitre encore leur maîtrise du Data Mining. Les volumes de données vont bien entendu augmenter, les types de données vont être de plus en plus hétérogènes, les domaines d’application vont s’élargir, et par conséquent le panel des méthodologies à maîtriser augmentera aussi proportionnellement.
Un spécialiste suggère que les fonctions de Data Management, aujourd’hui assumées par le Data Scientist, devraient pouvoir être confiées à des Data Managers encadrés par un Data Scientist afin que ce dernier consacre moins de temps à la préparation des données et davantage à l’analyse et l’interprétation des résultats.
En réalité, il n’y aurait pas finalement pour certains répondants « un Data Scientist » mais des Data scientists avec des compétences différentes qui devraient s’associer ensemble.
Affaire à suivre donc !
Définition du métier Data Scientist : une hybridation entre des métiers déjà connus
La plupart des répondants citent le métier de Data Miner en tant que dénomination précédente du métier de Data Scientist. Les termes de « Statisticien », « Chargé d’études statistiques » ou d’ « Analyste Statisticien » apparaissent également. L’un d’eux précise que cela diffère en fonction du pays. Aux Etats Unis, il s’agirait plutôt « d’informaticiens intelligents au solide bagage scientifique » alors qu’en France les profils seraient plutôt des Statisticiens sortis de formations scientifiques de type Grandes Ecoles.
Des compétences multiples aux socles de connaissance déjà existants
Le socle du Data Scientist est bien pour tous les répondants les statistiques. La notion de compétences multiples est très présente dans les réponses des experts et plusieurs avis concordent sur le fait que le Data Scientist doit disposer d’une triple compétence opérationnelle, à savoir :
• la maitrise des techniques du Data Mining et des Statistiques,
• une appétence aux technologies et aux outils informatiques des bases de données
• un savoir-faire métier dans le domaine d’application des données étudiées (le Marketing est principalement cité).
Un répondant s’interroge sur la notion du Data Scientist omniscient, qui cumulerait à lui seul les trois compétences et suggère que la clé du succès résidera certainement davantage dans le fait de faire collaborer managers, statisticiens et informaticiens.
Des missions précédemment dévolues dans le passé aux data miners
Au quotidien, la répartition des tâches incombant à la fonction de Data Scientist est très variable selon les secteurs, les enjeux, et le niveau d’expérience. Néanmoins, les grandes étapes qui structurent un projet sont citées (toutes ou en partie) par la plupart des répondants :
• Comprendre la problématique métier, les enjeux et les objectifs de l’analyse. Traduire un problème « business » en problème mathématiques/statistiques ;
• Obtenir des données adéquates : trouver les sources de données pertinentes, faire des recommandations sur les bases de données à consolider, modifier, rapatrier, externaliser, internaliser, concevoir des datamarts, voire des entrepôts de données (data warehouses) ;
• Evaluer la qualité et la richesse des données, les analyser et en restituer les résultats. Les intégrer dans le système d’information cible.
Certains répondants font remarquer que la plupart de ces missions étaient déjà dévolues au data miners.
Pas encore de formations dédiées
Les formations préconisées par les répondants sont principalement les écoles d’ingénieurs spécialisées en statistique (de type ENSAI, ENSAE, Télécom), les grandes écoles plus généralistes, de type Centrale, Polytechnique ou la formation continue de la CNAM. Dans tous les cas, le cursus doit associer les statistiques et le Data Mining à l’informatique. Certains confirment que le monde universitaire semble pour l’instant peu adapté (les outils récents n’y sont pas enseignés) et le déconseillent. D’autres préconisent même une formation plus pratique que théorique avec l’autoformation ou un apprentissage du Data Mining « sur le terrain ».
Un avenir prometteur, à condition de miser sur la complémentarité des métiers
Les retours des répondants quant à l’évolution de la fonction de Data Scientist sont plutôt positifs et porteurs d’espoirs. Un expert précise même que « Google annonce que c'est LE métier n°1 d'avenir ». En effet, la plupart des interrogés pensent que la fonction sera « de plus en plus reconnue », « de plus en plus demandée ». Les vrais Data Scientists seront d’ailleurs appelés à exercer des fonctions stratégiques au sein des entreprises. La demande étant croissante, l'écart entre demande et offre va continuer de se creuser et certaines fonctions vont nécessairement évoluer vers la fonction de Data Scientist. En pratique, les Data Scientists vont devoir être plus polyvalents dans les technologies et les outils maitrisés. Ils vont également devoir faire preuve de plus de pédagogie et accroitre encore leur maîtrise du Data Mining. Les volumes de données vont bien entendu augmenter, les types de données vont être de plus en plus hétérogènes, les domaines d’application vont s’élargir, et par conséquent le panel des méthodologies à maîtriser augmentera aussi proportionnellement.
Un spécialiste suggère que les fonctions de Data Management, aujourd’hui assumées par le Data Scientist, devraient pouvoir être confiées à des Data Managers encadrés par un Data Scientist afin que ce dernier consacre moins de temps à la préparation des données et davantage à l’analyse et l’interprétation des résultats.
En réalité, il n’y aurait pas finalement pour certains répondants « un Data Scientist » mais des Data scientists avec des compétences différentes qui devraient s’associer ensemble.
Affaire à suivre donc !
Autres articles
-
Thibaut Lagorce prend la direction du consulting chez SOCIO Logiciels
-
SOCIO Logiciels étoffe son département Recherche Opérationnelle
-
Bruno Colin rejoint SOCIO Logiciels, société du groupe NP6, en qualité de Directeur Général
-
NP6 opère un virage stratégique en acquérant Socio Logiciels, leader français de l’analyse des données statistiques et de la modélisation
-
Data mining : Thierry Vallaud sort un nouvel ouvrage