EMC Corporation (NYSE:EMC) a annoncé aujourd’hui les résultats de l’étude Digital Universe réalisée par IDC : « Big Data : Grand, plus grand, toujours plus grand » [i].
PC, smartphones mais également caméras de vidéosurveillance ou compteurs intelligents… La prolifération d’appareils connectés a largement contribué à l’explosion de l’univers numérique au cours des seules deux dernières années – il a été multiplié par 2 pour atteindre la taille considérable de 2,8 Zo et devrait peser 40 Zo à l’horizon 2020.
À titre de comparaison, 40 Zo de données équivalent à :
· 57 fois la quantité de tous les grains de sable de toutes les plages de la Terre, sachant que leur nombre est estimé à 700 500 000 000 000 000 000 (soit sept cents trillions cinq cents billions).
· Si nous pouvions sauvegarder 40 Zo sur des disques Blu-Ray, leur poids – sans pochette ni boîtier – serait comparable à celui de 424 porte-avions de classe Nimitz.
Principales découvertes :
· Une expansion rapide de l’univers numérique :
o L’univers numérique va doubler tous les deux ans entre aujourd’hui et 2020.
o On comptera environ 5 247 Go de données pour chaque homme, femme et enfant sur Terre en 2020.
o Le volume de données générées par des machines représentait 11 % de l’univers numérique en 2005 et devrait dépasser les 40 % en 2020.
· De grandes quantités de données utiles sont perdues : la promesse du Big Data tient à l’extraction de valeur à partir de vastes ensembles de données inexploitées. Toutefois, la majorité des nouvelles données est largement constituée de fichiers sans marquage et de données non structurées. Ce qui signifie que l’on sait peu de choses à leur sujet.
o En 2012, 23 % (643 exaoctets) de l’univers numérique pourrait être utile au Big Data s’il était marqué et analysé. Toutefois, seulement 3 % des données potentiellement utiles sont effectivement marquées ; une part encore plus faible est analysée (0,5 %).
o La quantité de données utiles progresse avec la croissance de l’univers numérique. À l’horizon 2020, 33 % de l’univers numérique (plus de 13 000 exaoctets) aura une valeur pour les applications Big Data s’il est marqué et analysé.
· Une vaste part de l’univers numérique n’est pas protégée : la quantité de données ayant besoin d’être protégées croît plus rapidement que l’univers numérique lui-même.
o Moins d’un tiers de l’univers numérique nécessitait une protection en 2010, mais cette proportion dépassera 40 % en 2020.
o En 2012, alors qu’environ 35 % de l’information disponible nécessitait une forme de protection, moins de 20 % en est effectivement dotée.
o Le niveau de protection varie selon les régions, avec bien moins de protection dans les marchés émergents.
Les défis tels que les menaces avancées, le déficit de compétences sécurité, et le manque d’adhésion aux pratiques de sécurité de référence chez les consommateurs et dans les entreprises vont continuer de renforcer le problème.
· Un renversement des rôles est imminent : Bien que l’univers numérique ait été un phénomène spécifique aux économies développées à ses débuts, la situation est sur le point de changer alors que la population des marchés émergents commence à étendre son empreinte.
o Les marchés émergents contribuaient à l’univers numérique à hauteur de 23 % en 2010 ; leur part a déjà atteint 36 % en 2012.
o À l’horizon 2020, IDC prévoit que 62 % de l’univers numérique pourra être attribué aux marchés émergents.
o L’univers numérique se répartit actuellement ainsi : États-Unis – 32 %, Europe de l’Ouest – 19 %, Chine – 13 %, Inde – 4 %, reste du monde – 32 %.
o À l’horizon 2020, la Chine devrait générer à elle seule 22 % des données du monde entier.
Autres découvertes clés :
· Le Cloud Computing jouant un rôle croissant dans la gestion du Big Data, le nombre de serveurs dans le monde devrait être multiplié par 10, et la quantité d’informations gérées directement dans les centres de calcul des entreprises devrait progresser d’un facteur 14.
· Le type des données stockées dans le Cloud se transformera radicalement au cours des prochaines années. D’ici 2020, IDC prévoit que 46,7 % des données stockées dans le Cloud seront liés aux loisirs. Le reste sera constitué de données de surveillance, de données médicales, et d’informations créées par les ordinateurs, les téléphones, et les appareils électroniques grand public.
· La quantité d’informations stockées dans l’univers numérique à propos d’utilisateurs individuels dépasse la quantité de données qu’ils créent eux-mêmes.
· L’Europe de l’Ouest est la région qui investit actuellement le plus pour gérer l’univers numérique, dépensant 2,49 $ par Go. Les États-Unis arrivent en seconde position avec 1,77 $ par Go, suivis par la Chine avec 1,31 $ par Go, et par l’Inde avec 0,87 $ par Go.
· L’infrastructure de l’univers numérique devenant de plus en plus connectée, l’information va se délocaliser de plus en plus de la région où elle est consommée. À l’horizon 2020, IDC estime que près de 40 % des données seront concernées par la virtualisation, c’est-à-dire qu’entre sa création et sa consommation, un octet sera stocké ou traité sur le Cloud.
Citation d’EMC :
Jeremy Burton, Vice-Président Exécutif, Opérations et Marketing Produits, EMC Corporation
“Face au volume et à la complexité croissantes des données à traiter, les entreprises doivent faire un choix : se noyer sous ce flot d’information, ou mettre en place les solutions nécessaires pour en tirer profit. L’étude Digital Universe 2012 met en valeur les bénéfices significatives qui s’offrent aux entreprises qui, non seulement, identifient les bénéfices potentiels de l’univers numérique, mais aussi reconnaissent l’importance du bon équilibre entre technologie, sécurité et compétences IT. C’est là qu’EMC intervient, en permettant à ses clients de gérer, protéger, et tirer profit de leurs données pour les traduire en avantage concurrentiel.”
[i] IDC Digital Universe Study, commandité par EMC, décembre 2012
PC, smartphones mais également caméras de vidéosurveillance ou compteurs intelligents… La prolifération d’appareils connectés a largement contribué à l’explosion de l’univers numérique au cours des seules deux dernières années – il a été multiplié par 2 pour atteindre la taille considérable de 2,8 Zo et devrait peser 40 Zo à l’horizon 2020.
À titre de comparaison, 40 Zo de données équivalent à :
· 57 fois la quantité de tous les grains de sable de toutes les plages de la Terre, sachant que leur nombre est estimé à 700 500 000 000 000 000 000 (soit sept cents trillions cinq cents billions).
· Si nous pouvions sauvegarder 40 Zo sur des disques Blu-Ray, leur poids – sans pochette ni boîtier – serait comparable à celui de 424 porte-avions de classe Nimitz.
Principales découvertes :
· Une expansion rapide de l’univers numérique :
o L’univers numérique va doubler tous les deux ans entre aujourd’hui et 2020.
o On comptera environ 5 247 Go de données pour chaque homme, femme et enfant sur Terre en 2020.
o Le volume de données générées par des machines représentait 11 % de l’univers numérique en 2005 et devrait dépasser les 40 % en 2020.
· De grandes quantités de données utiles sont perdues : la promesse du Big Data tient à l’extraction de valeur à partir de vastes ensembles de données inexploitées. Toutefois, la majorité des nouvelles données est largement constituée de fichiers sans marquage et de données non structurées. Ce qui signifie que l’on sait peu de choses à leur sujet.
o En 2012, 23 % (643 exaoctets) de l’univers numérique pourrait être utile au Big Data s’il était marqué et analysé. Toutefois, seulement 3 % des données potentiellement utiles sont effectivement marquées ; une part encore plus faible est analysée (0,5 %).
o La quantité de données utiles progresse avec la croissance de l’univers numérique. À l’horizon 2020, 33 % de l’univers numérique (plus de 13 000 exaoctets) aura une valeur pour les applications Big Data s’il est marqué et analysé.
· Une vaste part de l’univers numérique n’est pas protégée : la quantité de données ayant besoin d’être protégées croît plus rapidement que l’univers numérique lui-même.
o Moins d’un tiers de l’univers numérique nécessitait une protection en 2010, mais cette proportion dépassera 40 % en 2020.
o En 2012, alors qu’environ 35 % de l’information disponible nécessitait une forme de protection, moins de 20 % en est effectivement dotée.
o Le niveau de protection varie selon les régions, avec bien moins de protection dans les marchés émergents.
Les défis tels que les menaces avancées, le déficit de compétences sécurité, et le manque d’adhésion aux pratiques de sécurité de référence chez les consommateurs et dans les entreprises vont continuer de renforcer le problème.
· Un renversement des rôles est imminent : Bien que l’univers numérique ait été un phénomène spécifique aux économies développées à ses débuts, la situation est sur le point de changer alors que la population des marchés émergents commence à étendre son empreinte.
o Les marchés émergents contribuaient à l’univers numérique à hauteur de 23 % en 2010 ; leur part a déjà atteint 36 % en 2012.
o À l’horizon 2020, IDC prévoit que 62 % de l’univers numérique pourra être attribué aux marchés émergents.
o L’univers numérique se répartit actuellement ainsi : États-Unis – 32 %, Europe de l’Ouest – 19 %, Chine – 13 %, Inde – 4 %, reste du monde – 32 %.
o À l’horizon 2020, la Chine devrait générer à elle seule 22 % des données du monde entier.
Autres découvertes clés :
· Le Cloud Computing jouant un rôle croissant dans la gestion du Big Data, le nombre de serveurs dans le monde devrait être multiplié par 10, et la quantité d’informations gérées directement dans les centres de calcul des entreprises devrait progresser d’un facteur 14.
· Le type des données stockées dans le Cloud se transformera radicalement au cours des prochaines années. D’ici 2020, IDC prévoit que 46,7 % des données stockées dans le Cloud seront liés aux loisirs. Le reste sera constitué de données de surveillance, de données médicales, et d’informations créées par les ordinateurs, les téléphones, et les appareils électroniques grand public.
· La quantité d’informations stockées dans l’univers numérique à propos d’utilisateurs individuels dépasse la quantité de données qu’ils créent eux-mêmes.
· L’Europe de l’Ouest est la région qui investit actuellement le plus pour gérer l’univers numérique, dépensant 2,49 $ par Go. Les États-Unis arrivent en seconde position avec 1,77 $ par Go, suivis par la Chine avec 1,31 $ par Go, et par l’Inde avec 0,87 $ par Go.
· L’infrastructure de l’univers numérique devenant de plus en plus connectée, l’information va se délocaliser de plus en plus de la région où elle est consommée. À l’horizon 2020, IDC estime que près de 40 % des données seront concernées par la virtualisation, c’est-à-dire qu’entre sa création et sa consommation, un octet sera stocké ou traité sur le Cloud.
Citation d’EMC :
Jeremy Burton, Vice-Président Exécutif, Opérations et Marketing Produits, EMC Corporation
“Face au volume et à la complexité croissantes des données à traiter, les entreprises doivent faire un choix : se noyer sous ce flot d’information, ou mettre en place les solutions nécessaires pour en tirer profit. L’étude Digital Universe 2012 met en valeur les bénéfices significatives qui s’offrent aux entreprises qui, non seulement, identifient les bénéfices potentiels de l’univers numérique, mais aussi reconnaissent l’importance du bon équilibre entre technologie, sécurité et compétences IT. C’est là qu’EMC intervient, en permettant à ses clients de gérer, protéger, et tirer profit de leurs données pour les traduire en avantage concurrentiel.”
[i] IDC Digital Universe Study, commandité par EMC, décembre 2012
Autres articles
-
Precisely nommé leader dans le rapport 2024 d’IDC MarketScape : Worldwide Data Intelligence Platform Software
-
Rapport IDC pour Denodo : Les entreprises data-driven sont mieux armées pour l'ESG
-
Etude IDC pour Confluent : 93 % des entreprises rencontrent des difficultés pour tirer parti des données en temps réel
-
Les entreprises françaises ont encore du chemin à parcourir pour atteindre l’Intelligence Active en temps réel
-
+17% de chiffre d’affaires : c’est ce qu’obtiennent les entreprises qui se dotent d’outils d’analyse de la donnée selon une étude parrainée par Qlik