Les tests de performance de MapR dépassent les 100 millions de points de données d'acquisition par seconde


Rédigé par Communiqué de MapR Technologies le 11 Septembre 2014

Des résultats notoires obtenus sur des clusters restreints ouvrent la voie à de nouvelles applications IdO et à des analyses de données en temps réel



MapR Technologies, Inc., la première distribution pour Apache™ Hadoop®, annonce à l’occasion de « Tableau Conference », l'obtention de résultats de performance notoires, réalisés à l'aide d'un logiciel open source, OpenTSDB, en exécution sur la distribution MapR. En utilisant uniquement quatre nœuds d’un cluster de dix nœuds, la distribution MapR avec sa base de données intégrée à Hadoop NoSQL, MapR-DB, a acquis plus de 100 millions de points de données par seconde.

En accélérant les performances d'OpenTSDB d'un facteur 1 000 sur un cluster si restreint, MapR ouvre la voie à la gestion économique d'énormes volumes de données et permet de nouvelles applications telles que l'Internet des objets (IdO) et d'autres applications d'analyses de données en temps réel, y compris la surveillance industrielle des installations de fabrication, la maintenance prédictive des systèmes distribués de matériels et la surveillance des centres de données.

« L'accélération des performances pour OpenTSDB valide l'efficacité et l'échelle différenciée apportées par MapR », souligne Ted Dunning, architecte d'applications en chef pour MapR Technologies. « OpenTSDB est une base de données largement utilisée, destinée à stocker et analyser des données de séries chronologiques. Conçue à l'origine uniquement pour la surveillance du centre de données, de mauvaises acquisitions de performances ont limité le développement de son utilisation. Ce test de performance décrit une option viable pour de nouvelles applications, telles que des applications IdO et d'analyses de données en temps réel, à l'aide de OpenTSDB en exécution sur MapR ».

Selon les estimations de Cisco, il y aura environ 50 milliards d'appareils connectés d'ici à 2020. Ils comprennent des capteurs et d'autres périphériques incorporés de capture des données qui communiquent des informations en continu, repoussant les limites des plates-formes de gestion de données traditionnelles. Les services de santé, l'industrie et les services publics sont par exemple des secteurs où des décisions fondées sur l'analyse en continu des données peuvent permettre d'améliorer les opérations commerciales. Ces appareils seront utilisés à domicile et enverront des données. Les bases de données de séries chronologiques seront essentielles pour enregistrer et analyser ces ensembles de données.



Dans la même rubrique :