Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Greenplum, un futur concurrent open source pour Teradata et Netezza ?


Rédigé par le 21 Octobre 2005

La gestion de très grosses bases de données qui se comptent en Téraoctets est-elle réservée aux éditeurs spécialistes de ces architectures, Teradata, Netezza ou Oracle ? Ce n’est en tous cas pas ce que pense Greenplum, éditeur open source qui souhaite adapter la base PostgreSQL aux entrepôts de grande capacité.



Greenplum est l’éditeur de la solution Bizgres MPP qui prétend analyser des volumes de données de plusieurs téraoctets avec des temps de réponse de dix à cinquante fois inférieurs aux solutions traditionnelles du marché.
Pour mettre en pratique cette prouesse, l’éditeur explique qu’il a parallélisé au maximum les traitements et que ces derniers sont réalisés au plus proche des données afin de limiter les transferts en mémoire. Basé sur une architecture open source, Greenplum en profite pour annoncer d’excellents temps de réponse à des coûts eux aussi très inférieurs aux solutions du marché, par l’utilisation de la base PostgreSQL et éventuellement de Linux.

La solution Bizgres est disponible en version 0.7 beta, directement sur le site de Greenplum, en différentes versions pour Red Hat, Solaris ou Mac OS X. Elle est destinée au stockage de data marts de 10 à 300 Go, et Greenplum propose en option un contrat de support payant. Point positif, une documentation complète est disponible gratuitement en PDF sur le site.
La solution Bizgres MPP destinée aux grands entrepôts de données est en revanche commercialisée par l’éditeur. Des versions verticales sont prévues pour les secteurs d’activité fortement consommateurs de données, télécommunications, distribution, services financiers…
Une solution verticale dénommée Clickstream est prévue pour les marchands en ligne et fournisseurs d’informations sur le web, afin qu’ils puissent suivre et analyser le comportement de leurs visiteurs.

« Le prix du logiciel d’entreprise est ridiculement surévalué actuellement », explique-t-on chez Greenplum. « Nous pouvons proposer notre solution Bizgres MPP à un prix attractif d’une part car nous bénéficions de l’effet de levier de projets libres comme Linux, Open Solaris ou PostgreSQL, mais également de la disponibilité de clusters de machines à des prix très abordables ».

Soutenu par des investisseurs américains, Greenplum sera-t-il une pierre dans le jardin de Teradata qui propose sa solution complète matériel plus logiciel ? Et si Greenplum parvient à convaincre de grandes entreprises, seront-elles nombreuses à préférer une solution libre, mais peu connue à la sécurité d’un grand prestataire comme NCR ? C’est une question que se pose également tous les jours Netezza, autre concurrent de Teradata. Seule certitude un peu de concurrence ne peut pas faire de mal au consommateur-entreprise.




Commentaires

1.Posté par Bernard Fitoussi le 23/10/2005 19:45
Greenplum est en effet le troisième (après Netezza et Datallegro), outre Atlantique, à adopter une approche non conventionnelle du datawarehouse/datamart (Performances, facilité d'utilisation, Prix).Avec trois acteurs, nous sommes très clairement en face d'une tendance marquée, qui ne tardera pas à arriver en France.Bernard Fitoussi, Adwance A.D.bf@adwance.com

2.Posté par DUBAR Andreguy le 24/10/2005 12:33
Sybase IQ (Interactive Query) est une base de donnée relationnelle orientée décisionnel.Sans remise en cause de l'architecture existante !Sybase IQ est une solution logicielle qui capitalise sur les choix technologiques de l'entreprise.Plutôt que des TeraOctets stockés, parlons milliards de lignes dans les tables, avec du temps de réponse à la minute ...!Sybase IQ est certifié pour un schéma dont la table principale est de mille milliards de lignes ...!Ajoutons l'intérêt d'une grammaire Sql étendue d'operateurs d'agrégation .. J'y vois le signe fort que les bases opérationnelles traditionnelles ne couvrent pas suffisamment les enjeux du décisionnel.Andréguy DUBAR, Cenisis, adubar@cenisis.com

3.Posté par jamal Elfaiz le 13/10/2006 16:49
Le stockage des données est une chose, l'exploitation de ces même données avec des requetes de plus en plus complexes est une autre chose. Le full table scan est une chose assez facile chez teradata, mais que fait-on quand il y a plusieurs utilisateurs qui font des requestes hétérogènes (full table scan, jointure, aggregation, tri...)?
Ne confondons pas un DATWAREHOUSE et un WEREHOUSE of DATA!!!

Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store