Toby Martin – VP of Development & Strategy Extensis
Le Big Data collecte des volumes de données si importantes qu’ils ne peuvent être examinés avec les outils technologiques standard. Les métadonnées fournissent des informations sur un seul fichier tandis que le Big Data offre, à l’inverse, la possibilité de mettre à jour des modèles, des tendances concernant l’ensemble des données. Si les métadonnées sont l'aiguille, le Big Data est la botte de foin. Heureusement, l'aiguille est maintenant « intelligente ». Vous pourrez la trouver...si vous savez regarder.
Lorsqu'une ressource numérique est créée, celle-ci est immédiatement associée à des métadonnées concernant son origine, son heure, sa date, son format, etc. Ces informations ne sont plus suffisantes pour optimiser l’organisation du travail en entreprise. Chaque actif doit être nommé, étiqueté, stocké et archivé selon des normes communes définies. Une méthodologie cohérente de gestion des actifs est nécessaire pour mieux les trouver et les utiliser. D’après certains experts, les directeurs de marques consacrent 35 à 40% de leur temps à la recherche d'actifs. Un véritable gaspillage. Une bonne compréhension des métadonnées permet de remédier à ce problème.
Il est également important de souligner les différences entre les données structurées et non structurées. Les données structurées sont les attributs mentionnés précédemment (nom, date, format). Ces attributs permettent d’archiver et de stocker les fichiers. Ils permettent de traiter, d’analyser et de prédire les variables-clés liés à votre activité. Les données non structurées sont chaque appel, texte, achat, transfert, audio, vidéo, chat, post Facebook ou tweet. Les serveurs, appareils, compteurs et robots génèrent tous des journaux de données qui enregistrent chaque action. Pour devenir intelligibles, compréhensibles, ces données non structurées nécessitent une analyse préalable.
C'est là que le Big Data entre en jeu. Hadoop est un framework open-source permettant de stocker et de traiter un volume incroyable de données non-structurées, générées par un nombre croissant d'appareils électroniques et d’objets connectés. Les entreprises peuvent désormais collecter des quantités massives de données non-structurées et les analyser, pour prendre des décisions éclairées. Les décisionnaires sont ainsi en mesure d'anticiper les problèmes avant qu'ils ne surviennent. Ces possibilités inédites constituent un avantage inestimable, en particulier dans des secteurs où les pannes et les temps d'arrêt peuvent avoir des conséquences dramatiques.
Les petites entreprises n'ont pas besoin de bénéficier de toutes les performances offertes par Hadoop. En revanche, elles peuvent optimiser l’utilisation de leurs ressources en standardisant leurs méthodes de recherche, de distribution et d’archivage des ressources. Les formats et technologies se diversifient sans cesse. La standardisation de la gestion des actifs n’a jamais été aussi importante. Elle seule peut éviter aux entreprises de faire l’acquisition répétée d’un même actif. Avec une gestion cohérente, il n’est plus nécessaire de compter sur un seul contrôleur, chargé de savoir où se trouve chaque fichier. Si tous les collaborateurs d’une organisation parlent le même langage, la gestion des actifs s’en trouve nettement facilitée...Et le travail également.
Le Big Data et les métadonnées ont quelque chose en commun : ces données n'auront jamais que la valeur que vous leur donnez. Nos appareils et machines peuvent créer des données plus utiles que jamais, mais celles-ci n’auront aucune valeur si vous ne savez pas les interpréter et les contextualiser, pour mieux les trouver et les partager.
Lorsqu'une ressource numérique est créée, celle-ci est immédiatement associée à des métadonnées concernant son origine, son heure, sa date, son format, etc. Ces informations ne sont plus suffisantes pour optimiser l’organisation du travail en entreprise. Chaque actif doit être nommé, étiqueté, stocké et archivé selon des normes communes définies. Une méthodologie cohérente de gestion des actifs est nécessaire pour mieux les trouver et les utiliser. D’après certains experts, les directeurs de marques consacrent 35 à 40% de leur temps à la recherche d'actifs. Un véritable gaspillage. Une bonne compréhension des métadonnées permet de remédier à ce problème.
Il est également important de souligner les différences entre les données structurées et non structurées. Les données structurées sont les attributs mentionnés précédemment (nom, date, format). Ces attributs permettent d’archiver et de stocker les fichiers. Ils permettent de traiter, d’analyser et de prédire les variables-clés liés à votre activité. Les données non structurées sont chaque appel, texte, achat, transfert, audio, vidéo, chat, post Facebook ou tweet. Les serveurs, appareils, compteurs et robots génèrent tous des journaux de données qui enregistrent chaque action. Pour devenir intelligibles, compréhensibles, ces données non structurées nécessitent une analyse préalable.
C'est là que le Big Data entre en jeu. Hadoop est un framework open-source permettant de stocker et de traiter un volume incroyable de données non-structurées, générées par un nombre croissant d'appareils électroniques et d’objets connectés. Les entreprises peuvent désormais collecter des quantités massives de données non-structurées et les analyser, pour prendre des décisions éclairées. Les décisionnaires sont ainsi en mesure d'anticiper les problèmes avant qu'ils ne surviennent. Ces possibilités inédites constituent un avantage inestimable, en particulier dans des secteurs où les pannes et les temps d'arrêt peuvent avoir des conséquences dramatiques.
Les petites entreprises n'ont pas besoin de bénéficier de toutes les performances offertes par Hadoop. En revanche, elles peuvent optimiser l’utilisation de leurs ressources en standardisant leurs méthodes de recherche, de distribution et d’archivage des ressources. Les formats et technologies se diversifient sans cesse. La standardisation de la gestion des actifs n’a jamais été aussi importante. Elle seule peut éviter aux entreprises de faire l’acquisition répétée d’un même actif. Avec une gestion cohérente, il n’est plus nécessaire de compter sur un seul contrôleur, chargé de savoir où se trouve chaque fichier. Si tous les collaborateurs d’une organisation parlent le même langage, la gestion des actifs s’en trouve nettement facilitée...Et le travail également.
Le Big Data et les métadonnées ont quelque chose en commun : ces données n'auront jamais que la valeur que vous leur donnez. Nos appareils et machines peuvent créer des données plus utiles que jamais, mais celles-ci n’auront aucune valeur si vous ne savez pas les interpréter et les contextualiser, pour mieux les trouver et les partager.