Olivier Lebret, Responsable de l'offre analytique, Dell France
Le tourbillon médiatique autour des données non structurées et des nouvelles plateformes Big Data nous fait oublier le rôle des données structurées et du traditionnel système de gestion de bases de données relationnelles (RDBMS). Comparées au Big Data, les données structurées et les technologies RDBMS traditionnelles semblent reléguées au passé, si bien que l’on pourrait croire légitimement qu’elles ont nettement perdu de leur importance.
Mais cette approche a beau être légitime, elle n’en est pas moins fausse. A en croire les résultats d’une nouvelle enquête auprès de 300 administrateurs de bases de données (DBA) et d’autres responsables de la gestion des données en entreprise, les types de données non structurées et les nouveaux systèmes de gestion de base des données ont beau jouer un rôle prépondérant dans l’écosystème moderne, les données structurées des systèmes de gestion de bases de données relationnelles (RDBMS) demeurent la fondation de l’infrastructure d’information de la plupart des entreprises. L’enquête menée par Unisphere Research indique que, malgré le buzz autour du Big Data, la plupart des organisations continuent de se focaliser essentiellement sur la gestion des données structurées et ce sera encore le cas pour un certain temps.
Les données structurées et les bases de données relationnelles continuent de dominer
L’enquête Unisphere fournit de nombreux indicateurs significatifs sur la véritable nature du paysage de la gestion des bases de données. Par exemple, alors que la gestion des données non structurées va gagner en importance, stimulée par les technologies analytiques avancées, les données structurées représentent toujours 75% des données que gèrent plus des deux tiers des organisations, avec près d’un tiers des organisations qui n’ont pas encore d’approche active de la gestion des données non structurées.
L’enquête révèle également que Oracle et Microsoft SQL Server, les plus traditionnelles des bases de données traditionnelles, demeurent les plateformes que les organisations utilisent le plus couramment pour leurs données stratégiques. De surcroît, même si Hadoop et NoSQL sont de nouvelles technologies prometteuses, et que beaucoup a déjà été fait pour promouvoir leur utilisation par les entreprises pour gérer leurs données non structurées, la plupart des sociétés sont encore loin de prévoir leur utilisation dans leurs plans de gestion des données.
Donner du sens à un paysage complexe
Le degré de complexité qui caractérise la gestion des données et de l’information n’a rien de provisoire. Dans les années qui viennent, l’infrastructure de l’information va gagner en sophistication et il deviendra impératif de valoriser les données pour faciliter la prise de décision, pour gagner en efficacité opérationnelle et pour générer de nouvelles sources de revenu. La question porte plutôt sur ce que les DSI et les équipes de gestion des bases de données font pour valoriser leurs environnements de données complexes.
Pour commencer, ils ne doivent pas négliger le Big Data, même si le niveau réel d’application des technologies Big Data est encore loin de ce qu’annoncent les prévisionnistes. Le fait que les données structurées et les technologies de bases de données relationnelles restent dominantes ne signifie pas que le Big Data est mort, ni que l’adoption des technologies plus anciennes comme Hadoop et les bases de données NoSQL ne va pas se poursuivre. Les types de données non structurées et les nouveaux systèmes de gestion des données vont incontestablement jouer un rôle de plus en plus important dans l’écosystème moderne des données, et les DSI doivent être préparés à administrer un monde marqué par la complexité. Ceci dit, voici plusieurs bonnes pratiques à recommander aux organisations de toute taille, quelle que soit la nature de leur activité.
1 – Développer une stratégie englobant toutes les données
L’une des questions que posent le plus souvent les clients porte sur le choix de la priorité : données structurées ou non structurées, bases de données relationnelles ou NoSQL, données transactionnelles ou réseaux sociaux ? Dans tous les cas, la réponse est « tout ». La gestion réussie de l’information ne porte pas sur la gestion du Big Data ou des seules données traditionnelles, mais sur l’optimisation, l’accessibilité, l’intégration et l’analyse de toutes les données existantes, quels qu’en soit le volume ou la provenance. Les entreprises qui pourront le faire sont celles qui feront tomber les silos et se positionneront le mieux pour saisir les opportunités offertes par l’économie moderne fondée sur les données.
2 – Préparer la révolution analytique à venir
Selon l’enquête d’Unisphere, la nécessité de rendre possibles des scénarios analytiques est le facteur numéro un de l’adoption des nouveaux systèmes de gestion des bases de données, et il y a de bonnes raisons à cela. Demandez à n’importe quel DSI quelles sont ses priorités et il vous répondra invariablement que sa priorité absolue est de réussir à transformer toutes les données disponibles en information décisionnelle exploitable pour aider la direction à faire les meilleurs choix stratégiques. C’est d’ailleurs la finalité, mais aussi la raison de la forte médiatisation du Big Data et ce pour quoi on consacre volontiers autant de temps et d’efforts à la gestion des données et de l’information.
Les organisations qui souhaitent rester compétitives doivent se doter d’une infrastructure de gestion de l’information prête à supporter les applications analytiques avancées modernes. Il ne suffit pas d’utiliser les données pour analyser ce qui s’est passé. Désormais, il s’agit surtout de comprendre et d’anticiper ce qui va se produire à l’avenir. Les DSI doivent investir dans des plateformes et des technologies de gestion des données (des outils d’intégration des données ouverts sur le Cloud, par exemple), capables d’accompagner la mise en œuvre d’initiatives analytiques. Le plus souvent, il s’agira de combiner les solutions modernes et traditionnelles de gestion de l’information.
3 – Préparer les administrateurs de bases de données à leurs futures fonctions
Alors que les déploiements des technologies Hadoop et NoSQL se multiplient dans les entreprises, le rôle de l’administrateur de base de données va prendre de l’importance. Selon l’enquête, la plupart des administrateurs gèrent déjà de multiples instances de bases de données, parfois de cinq fournisseurs différents quand ce n’est pas plus. Cette tendance n’est pas près de ralentir. Qu’elles recrutent ou qu’elles optent pour la formation interne, ou un mélange des deux, les entreprises doivent se constituer une équipe d’administrateurs DBA armés pour assumer cette diversité de nouvelles fonctions.
Avant toute chose, les organisations doivent être proactives. L’utilisation intelligente des données n’est plus seulement souhaitable. C’est devenu un impératif. En élaborant une stratégie de gestion des données applicable à tous les types de données, qui prépare à l’adoption de solutions analytiques avancées et qui aide les membres des équipes à exceller en dépit de la complexité ambiante, les entreprises ne doivent pas seulement aspirer à survivre dans l’économie de la donnée, mais viser la prospérité.
Mais cette approche a beau être légitime, elle n’en est pas moins fausse. A en croire les résultats d’une nouvelle enquête auprès de 300 administrateurs de bases de données (DBA) et d’autres responsables de la gestion des données en entreprise, les types de données non structurées et les nouveaux systèmes de gestion de base des données ont beau jouer un rôle prépondérant dans l’écosystème moderne, les données structurées des systèmes de gestion de bases de données relationnelles (RDBMS) demeurent la fondation de l’infrastructure d’information de la plupart des entreprises. L’enquête menée par Unisphere Research indique que, malgré le buzz autour du Big Data, la plupart des organisations continuent de se focaliser essentiellement sur la gestion des données structurées et ce sera encore le cas pour un certain temps.
Les données structurées et les bases de données relationnelles continuent de dominer
L’enquête Unisphere fournit de nombreux indicateurs significatifs sur la véritable nature du paysage de la gestion des bases de données. Par exemple, alors que la gestion des données non structurées va gagner en importance, stimulée par les technologies analytiques avancées, les données structurées représentent toujours 75% des données que gèrent plus des deux tiers des organisations, avec près d’un tiers des organisations qui n’ont pas encore d’approche active de la gestion des données non structurées.
L’enquête révèle également que Oracle et Microsoft SQL Server, les plus traditionnelles des bases de données traditionnelles, demeurent les plateformes que les organisations utilisent le plus couramment pour leurs données stratégiques. De surcroît, même si Hadoop et NoSQL sont de nouvelles technologies prometteuses, et que beaucoup a déjà été fait pour promouvoir leur utilisation par les entreprises pour gérer leurs données non structurées, la plupart des sociétés sont encore loin de prévoir leur utilisation dans leurs plans de gestion des données.
Donner du sens à un paysage complexe
Le degré de complexité qui caractérise la gestion des données et de l’information n’a rien de provisoire. Dans les années qui viennent, l’infrastructure de l’information va gagner en sophistication et il deviendra impératif de valoriser les données pour faciliter la prise de décision, pour gagner en efficacité opérationnelle et pour générer de nouvelles sources de revenu. La question porte plutôt sur ce que les DSI et les équipes de gestion des bases de données font pour valoriser leurs environnements de données complexes.
Pour commencer, ils ne doivent pas négliger le Big Data, même si le niveau réel d’application des technologies Big Data est encore loin de ce qu’annoncent les prévisionnistes. Le fait que les données structurées et les technologies de bases de données relationnelles restent dominantes ne signifie pas que le Big Data est mort, ni que l’adoption des technologies plus anciennes comme Hadoop et les bases de données NoSQL ne va pas se poursuivre. Les types de données non structurées et les nouveaux systèmes de gestion des données vont incontestablement jouer un rôle de plus en plus important dans l’écosystème moderne des données, et les DSI doivent être préparés à administrer un monde marqué par la complexité. Ceci dit, voici plusieurs bonnes pratiques à recommander aux organisations de toute taille, quelle que soit la nature de leur activité.
1 – Développer une stratégie englobant toutes les données
L’une des questions que posent le plus souvent les clients porte sur le choix de la priorité : données structurées ou non structurées, bases de données relationnelles ou NoSQL, données transactionnelles ou réseaux sociaux ? Dans tous les cas, la réponse est « tout ». La gestion réussie de l’information ne porte pas sur la gestion du Big Data ou des seules données traditionnelles, mais sur l’optimisation, l’accessibilité, l’intégration et l’analyse de toutes les données existantes, quels qu’en soit le volume ou la provenance. Les entreprises qui pourront le faire sont celles qui feront tomber les silos et se positionneront le mieux pour saisir les opportunités offertes par l’économie moderne fondée sur les données.
2 – Préparer la révolution analytique à venir
Selon l’enquête d’Unisphere, la nécessité de rendre possibles des scénarios analytiques est le facteur numéro un de l’adoption des nouveaux systèmes de gestion des bases de données, et il y a de bonnes raisons à cela. Demandez à n’importe quel DSI quelles sont ses priorités et il vous répondra invariablement que sa priorité absolue est de réussir à transformer toutes les données disponibles en information décisionnelle exploitable pour aider la direction à faire les meilleurs choix stratégiques. C’est d’ailleurs la finalité, mais aussi la raison de la forte médiatisation du Big Data et ce pour quoi on consacre volontiers autant de temps et d’efforts à la gestion des données et de l’information.
Les organisations qui souhaitent rester compétitives doivent se doter d’une infrastructure de gestion de l’information prête à supporter les applications analytiques avancées modernes. Il ne suffit pas d’utiliser les données pour analyser ce qui s’est passé. Désormais, il s’agit surtout de comprendre et d’anticiper ce qui va se produire à l’avenir. Les DSI doivent investir dans des plateformes et des technologies de gestion des données (des outils d’intégration des données ouverts sur le Cloud, par exemple), capables d’accompagner la mise en œuvre d’initiatives analytiques. Le plus souvent, il s’agira de combiner les solutions modernes et traditionnelles de gestion de l’information.
3 – Préparer les administrateurs de bases de données à leurs futures fonctions
Alors que les déploiements des technologies Hadoop et NoSQL se multiplient dans les entreprises, le rôle de l’administrateur de base de données va prendre de l’importance. Selon l’enquête, la plupart des administrateurs gèrent déjà de multiples instances de bases de données, parfois de cinq fournisseurs différents quand ce n’est pas plus. Cette tendance n’est pas près de ralentir. Qu’elles recrutent ou qu’elles optent pour la formation interne, ou un mélange des deux, les entreprises doivent se constituer une équipe d’administrateurs DBA armés pour assumer cette diversité de nouvelles fonctions.
Avant toute chose, les organisations doivent être proactives. L’utilisation intelligente des données n’est plus seulement souhaitable. C’est devenu un impératif. En élaborant une stratégie de gestion des données applicable à tous les types de données, qui prépare à l’adoption de solutions analytiques avancées et qui aide les membres des équipes à exceller en dépit de la complexité ambiante, les entreprises ne doivent pas seulement aspirer à survivre dans l’économie de la donnée, mais viser la prospérité.
En charge du développement de l’offre analytique de Dell Software sur le marché européen, Olivier Lebret conseille et participe à la mise en place des solutions Dell Statistica auprès des clients de Dell dans tous les domaines ayant des problématiques d’analyse et de traitement/scoring des données ainsi que de reporting, notamment sur des problématiques Big Data.