Michel Bruley, Directeur Marketing EMEA de Teradata Aster
LinkedIn qui a été créée en 2003, réalise actuellement 243 Millions de chiffres d’affaires et emploie 1797 personnes. Ce n’est pas ce que l’on appelle une grande entreprise. Cependant LinkedIn a 175 millions de membres répartis dans 200 pays dont 50% en dehors des Etats Unis, deux nouveaux membres se joignent au réseau chaque seconde, et il se dit que tous les « exécutives » des 500 premières entreprises mondiales sont membres. Dans ces conditions, LinkedIn est confrontée à une forte volumétrie de données à traiter. En effet leur système d’information doit supporter par an 2 milliards de recherches effectués par les membres, traiter par jour 75 To de données et 10 milliards de lignes.
En analysant toutes ses données LinkedIn est capable par exemple d’établir le palmarès des mots les plus utilisés par ses membres pour décrire leurs capacités, et ces mots varient d’un pays à l’autre. Aux Etats-Unis et au Canada on met en avant l’étendu de l’expérience, alors qu’en Italie, en France ou en Allemagne on se dit innovant, qu’au Brésil et en Espagne on est dynamique et qu’en Grande Bretagne on met en avant sa motivation.
linkedIn est très certainement une des sociétés qui participent au développement de ce que l’on appelle aujourd’hui dans le monde des affaires la « Science des Données », cette dernière se fonde sur des savoirs faire issus de l’informatique, des mathématiques, de l’analyse de données et du management des affaires. Concrètement il s’agit de pouvoir rapidement collecter des données brutes, les explorer et les analyser, de traduire ces données en informations décisionnelles, et donc globalement de réduire le temps entre la découverte de faits pertinents, la caractérisation d’opportunité métier et le déclenchement d’actions.
Mais qu'est-ce que LinkedIn fait avec ses données ? Elle classiquement fait des analyses pour mieux comprendre et conduire ses activités, mais surtout elle crée des produits / services fondés sur les informations qu’elle génère, soit globalement comme avec les mots les plus utilisés vus ci-dessus, soit individuellement avec des systèmes de recommandations (les gens que vous connaissez peut-être, les emplois qui ...). Les données permettent par exemple : d’identifier des influenceurs et des tendances sociales en matière de viralité ; de tester de nouveaux produits / services, de nouveaux sites pour maximiser l'impact sur l'activité de connexion et l'utilisation du site par les membres ; de comprendre l'utilisation des services dans le temps en fonction des niveaux d'abonnement, du moyen de connexion (PC, mobile, ...) ; de fournir des rapports détaillés d’analyse des revenus publicitaires ; d’évaluer l’impact d’action de marketing viral ; d’optimiser les moteur de recommandations ; de créer des fonctions spécialisées pour les services pour les entreprises (marketing, recrutement, ...).
Pour pouvoir obtenir ces résultats intéressants de l’exploitation de ses données, LinkedIn a dû développer ses propres applications de gestion des flux de données, de stockage, de recherche, d’analyse de réseaux, etc. et bien entendu ses propres tableaux de bord. Pour cela la société est allée chercher sur le marché les outils ou les solutions dont elles avaient besoin, et l’on peut donc lister de façon non exhaustive : Teradata Aster, Hadoop, Azkaban, Kafka, Project Voldemort, Pig, Pithon, Prefuse, Microstrategy, Tableau software.
Pour aller plus loin à propos du cas LinkedIn, vous pouvez utilement suivre la présentation vidéo de 50’ ci-dessous, intitulée « Data Science @ LinkedIn : Insight & Innovation at Scale », de Manu Sharma, Principal Research Scientist and Group Manager, Product Analytics, chez LinkedIn.
En analysant toutes ses données LinkedIn est capable par exemple d’établir le palmarès des mots les plus utilisés par ses membres pour décrire leurs capacités, et ces mots varient d’un pays à l’autre. Aux Etats-Unis et au Canada on met en avant l’étendu de l’expérience, alors qu’en Italie, en France ou en Allemagne on se dit innovant, qu’au Brésil et en Espagne on est dynamique et qu’en Grande Bretagne on met en avant sa motivation.
linkedIn est très certainement une des sociétés qui participent au développement de ce que l’on appelle aujourd’hui dans le monde des affaires la « Science des Données », cette dernière se fonde sur des savoirs faire issus de l’informatique, des mathématiques, de l’analyse de données et du management des affaires. Concrètement il s’agit de pouvoir rapidement collecter des données brutes, les explorer et les analyser, de traduire ces données en informations décisionnelles, et donc globalement de réduire le temps entre la découverte de faits pertinents, la caractérisation d’opportunité métier et le déclenchement d’actions.
Mais qu'est-ce que LinkedIn fait avec ses données ? Elle classiquement fait des analyses pour mieux comprendre et conduire ses activités, mais surtout elle crée des produits / services fondés sur les informations qu’elle génère, soit globalement comme avec les mots les plus utilisés vus ci-dessus, soit individuellement avec des systèmes de recommandations (les gens que vous connaissez peut-être, les emplois qui ...). Les données permettent par exemple : d’identifier des influenceurs et des tendances sociales en matière de viralité ; de tester de nouveaux produits / services, de nouveaux sites pour maximiser l'impact sur l'activité de connexion et l'utilisation du site par les membres ; de comprendre l'utilisation des services dans le temps en fonction des niveaux d'abonnement, du moyen de connexion (PC, mobile, ...) ; de fournir des rapports détaillés d’analyse des revenus publicitaires ; d’évaluer l’impact d’action de marketing viral ; d’optimiser les moteur de recommandations ; de créer des fonctions spécialisées pour les services pour les entreprises (marketing, recrutement, ...).
Pour pouvoir obtenir ces résultats intéressants de l’exploitation de ses données, LinkedIn a dû développer ses propres applications de gestion des flux de données, de stockage, de recherche, d’analyse de réseaux, etc. et bien entendu ses propres tableaux de bord. Pour cela la société est allée chercher sur le marché les outils ou les solutions dont elles avaient besoin, et l’on peut donc lister de façon non exhaustive : Teradata Aster, Hadoop, Azkaban, Kafka, Project Voldemort, Pig, Pithon, Prefuse, Microstrategy, Tableau software.
Pour aller plus loin à propos du cas LinkedIn, vous pouvez utilement suivre la présentation vidéo de 50’ ci-dessous, intitulée « Data Science @ LinkedIn : Insight & Innovation at Scale », de Manu Sharma, Principal Research Scientist and Group Manager, Product Analytics, chez LinkedIn.
Autres articles
-
Teradata lance des cas d’usage d’IA générative à démarrage rapide grâce à l’intégration d’Amazon Bedrock
-
Teradata nomme Louis Landry au poste de Chief Technology Officer
-
Teradata AI Unlimited pour Microsoft Fabric est désormais disponible en avant-première via Microsoft Fabric Workload Hub
-
Teradata facilite l’application concrète de l’IA générative et accélère la création de valeur pour les entreprises
-
Teradata propose des capacités d’IA exceptionnelles pour les grandes entreprises et les environnements hybrides en collaboration avec NVIDIA