Une machine
Deux pas à droite, deux pas à gauche, quatre pas en arrière... non, le projet Madison de Microsoft ne devrait pas reprendre la chorégraphie de la danse éponyme, star des années 60. Rappelons nous plutôt que le Madison est une danse en ligne, qui accueille donc plusieurs colonnes et plusieurs lignes de danseurs et rappelle certaines formes de stockage de données...
Le projet Madison a été annoncé par Microsoft après le rachat de DATAllegro, il y a un peu plus d’un an. Il consiste à proposer une « appliance » massivement parallèle, basée sur SQL Server 2008 pour le stockage des données et qui permettrait d’atteindre des vitesses rapides de chargement et d’interrogation de données sur des volumes allant jusqu’au Petaoctet.
Microsoft vient de rendre publique l’installation de la première version de Madison, baptisée « technology preview », auprès de quelques clients sélectionnés. La version finale ne devrait pas être disponible avant le milieu de l’année 2010, mais le programme de test devrait être peu à peu élargi. A ce jour, dix entreprises auraient reçu cette première version.
Microsoft avance des temps de chargement allant jusqu’à 1 To par heure, et des temps d’interrogation fulgurants de 1,5 To par minute.
La solution technique est basée sur Windows Server 2008, SQL Server 2008 et une nouvelle mouture de l’entrepôt massivement parallèle de DATAllegro porté sur SQL Server 2008. Microsoft annonce des temps d’interrogation cinq fois plus rapides sur cette nouvelle configuration, par rapport aux versions précédentes de DATAllegro.
Les premiers tests restent sans doute modestes face à la capacité annoncée du Petaoctet, ainsi Premier Bankcard LLC, un des beta-testeurs, a mis en place la solution pour héberger à ce jour 20 To de données.
Même s’il s’agit bien d’une « appliance » c’est à dire d’une solution globale matériel et logiciel, Microsoft a choisi de s’appuyer sur des offres matérielles standard du marché. Les constructeurs HP et Dell sont cités, mais EMC pourrait également fournir des composants de stockage. La machine proposée comprendra entre huit et vingt noeuds. Elle sera composée de serveurs de bases de données, reliés entre eux par un réseau à haute vitesse. Les machines elles-mêmes pourront être reliées entre elles et composer une « grille » de serveurs.
Certes l’usage de solutions standard devrait permettre à Microsoft de faire baisser le prix des « appliances », par rapport à ses deux concurrents principaux sur le marché, Teradata et Netezza. Mais les entreprises confronteront rapidement les deux arguments : machines standards à coût réduit chez Microsoft, machines propriétaires plus onéreuses chez Teradata et Netezza (même si ce dernier cherche à se positionner également sur des machines plus standards).
La différence se fera d’une part sur les performances et seuls les tests réels permettront de vérifier si Madison atteint les performances promises. Mais elle se fera aussi sur l’environnement logiciel (les applications métiers par exemple) et sur la compétence des prestataires. Installer et optimiser un entrepôt de données de l’ordre du Petaoctet n’est pas une chose simple... Microsoft devra démontrer qu’il a acquis ces compétences et que ses partenaires se sont formés.
Le projet Madison a été annoncé par Microsoft après le rachat de DATAllegro, il y a un peu plus d’un an. Il consiste à proposer une « appliance » massivement parallèle, basée sur SQL Server 2008 pour le stockage des données et qui permettrait d’atteindre des vitesses rapides de chargement et d’interrogation de données sur des volumes allant jusqu’au Petaoctet.
Microsoft vient de rendre publique l’installation de la première version de Madison, baptisée « technology preview », auprès de quelques clients sélectionnés. La version finale ne devrait pas être disponible avant le milieu de l’année 2010, mais le programme de test devrait être peu à peu élargi. A ce jour, dix entreprises auraient reçu cette première version.
Microsoft avance des temps de chargement allant jusqu’à 1 To par heure, et des temps d’interrogation fulgurants de 1,5 To par minute.
La solution technique est basée sur Windows Server 2008, SQL Server 2008 et une nouvelle mouture de l’entrepôt massivement parallèle de DATAllegro porté sur SQL Server 2008. Microsoft annonce des temps d’interrogation cinq fois plus rapides sur cette nouvelle configuration, par rapport aux versions précédentes de DATAllegro.
Les premiers tests restent sans doute modestes face à la capacité annoncée du Petaoctet, ainsi Premier Bankcard LLC, un des beta-testeurs, a mis en place la solution pour héberger à ce jour 20 To de données.
Même s’il s’agit bien d’une « appliance » c’est à dire d’une solution globale matériel et logiciel, Microsoft a choisi de s’appuyer sur des offres matérielles standard du marché. Les constructeurs HP et Dell sont cités, mais EMC pourrait également fournir des composants de stockage. La machine proposée comprendra entre huit et vingt noeuds. Elle sera composée de serveurs de bases de données, reliés entre eux par un réseau à haute vitesse. Les machines elles-mêmes pourront être reliées entre elles et composer une « grille » de serveurs.
Certes l’usage de solutions standard devrait permettre à Microsoft de faire baisser le prix des « appliances », par rapport à ses deux concurrents principaux sur le marché, Teradata et Netezza. Mais les entreprises confronteront rapidement les deux arguments : machines standards à coût réduit chez Microsoft, machines propriétaires plus onéreuses chez Teradata et Netezza (même si ce dernier cherche à se positionner également sur des machines plus standards).
La différence se fera d’une part sur les performances et seuls les tests réels permettront de vérifier si Madison atteint les performances promises. Mais elle se fera aussi sur l’environnement logiciel (les applications métiers par exemple) et sur la compétence des prestataires. Installer et optimiser un entrepôt de données de l’ordre du Petaoctet n’est pas une chose simple... Microsoft devra démontrer qu’il a acquis ces compétences et que ses partenaires se sont formés.