MapR Technologies, Inc., la première distribution pour Apache™ Hadoop®, annonce à l’occasion de « Tableau Conference », l'obtention de résultats de performance notoires, réalisés à l'aide d'un logiciel open source, OpenTSDB, en exécution sur la distribution MapR. En utilisant uniquement quatre nœuds d’un cluster de dix nœuds, la distribution MapR avec sa base de données intégrée à Hadoop NoSQL, MapR-DB, a acquis plus de 100 millions de points de données par seconde.
En accélérant les performances d'OpenTSDB d'un facteur 1 000 sur un cluster si restreint, MapR ouvre la voie à la gestion économique d'énormes volumes de données et permet de nouvelles applications telles que l'Internet des objets (IdO) et d'autres applications d'analyses de données en temps réel, y compris la surveillance industrielle des installations de fabrication, la maintenance prédictive des systèmes distribués de matériels et la surveillance des centres de données.
« L'accélération des performances pour OpenTSDB valide l'efficacité et l'échelle différenciée apportées par MapR », souligne Ted Dunning, architecte d'applications en chef pour MapR Technologies. « OpenTSDB est une base de données largement utilisée, destinée à stocker et analyser des données de séries chronologiques. Conçue à l'origine uniquement pour la surveillance du centre de données, de mauvaises acquisitions de performances ont limité le développement de son utilisation. Ce test de performance décrit une option viable pour de nouvelles applications, telles que des applications IdO et d'analyses de données en temps réel, à l'aide de OpenTSDB en exécution sur MapR ».
Selon les estimations de Cisco, il y aura environ 50 milliards d'appareils connectés d'ici à 2020. Ils comprennent des capteurs et d'autres périphériques incorporés de capture des données qui communiquent des informations en continu, repoussant les limites des plates-formes de gestion de données traditionnelles. Les services de santé, l'industrie et les services publics sont par exemple des secteurs où des décisions fondées sur l'analyse en continu des données peuvent permettre d'améliorer les opérations commerciales. Ces appareils seront utilisés à domicile et enverront des données. Les bases de données de séries chronologiques seront essentielles pour enregistrer et analyser ces ensembles de données.
En accélérant les performances d'OpenTSDB d'un facteur 1 000 sur un cluster si restreint, MapR ouvre la voie à la gestion économique d'énormes volumes de données et permet de nouvelles applications telles que l'Internet des objets (IdO) et d'autres applications d'analyses de données en temps réel, y compris la surveillance industrielle des installations de fabrication, la maintenance prédictive des systèmes distribués de matériels et la surveillance des centres de données.
« L'accélération des performances pour OpenTSDB valide l'efficacité et l'échelle différenciée apportées par MapR », souligne Ted Dunning, architecte d'applications en chef pour MapR Technologies. « OpenTSDB est une base de données largement utilisée, destinée à stocker et analyser des données de séries chronologiques. Conçue à l'origine uniquement pour la surveillance du centre de données, de mauvaises acquisitions de performances ont limité le développement de son utilisation. Ce test de performance décrit une option viable pour de nouvelles applications, telles que des applications IdO et d'analyses de données en temps réel, à l'aide de OpenTSDB en exécution sur MapR ».
Selon les estimations de Cisco, il y aura environ 50 milliards d'appareils connectés d'ici à 2020. Ils comprennent des capteurs et d'autres périphériques incorporés de capture des données qui communiquent des informations en continu, repoussant les limites des plates-formes de gestion de données traditionnelles. Les services de santé, l'industrie et les services publics sont par exemple des secteurs où des décisions fondées sur l'analyse en continu des données peuvent permettre d'améliorer les opérations commerciales. Ces appareils seront utilisés à domicile et enverront des données. Les bases de données de séries chronologiques seront essentielles pour enregistrer et analyser ces ensembles de données.
Autres articles
-
Salesforce dévoile une mise à jour de Tableau Einstein pour intégrer les agents IA autonomes sur sa plateforme analytique
-
Avec une capacité de traitement de 100 milliards d’interactions par jour, Salesforce Genie Customer Data Cloud et Tableau accélèrent la prise de décision en entreprise
-
Salesforce annonce la nomination de Jean-David Benassouli au poste de Vice-Président Analytics, à la tête de Tableau en France
-
Snowflake vs Hadoop : lequel choisir ?
-
Les évolutions de Hadoop en 2022