Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Cray annonce Urika-GX, l’appliance ultime pour l’analytique ?


Rédigé par le 24 Mai 2016

Teradata, Netezza, Oracle, EMC… on parle beaucoup moins ces derniers temps des “appliances” comme solution de stockage et de traitement des Big Data. Mais Cray, qui s’y connaît en calcul à haute performance, continue de croire en ce marché, et annonce aujourd’hui une machine “ultime”, au caractéristiques matérielles et logicielles impressionnantes : un cadeau de Noël prochain pour les data scientists ?



A gauche, le Cray XMP du musée de l'informatique en 2010 / A droite la nouvelle machine Cray Urika-GX
A gauche, le Cray XMP du musée de l'informatique en 2010 / A droite la nouvelle machine Cray Urika-GX
Le temps de Cray Research, pionnier au travers de son fondateur Seynour Cray, des super-calculateurs, est bien loin - on parle de 1972 - et la marque Cray a connu plusieurs épisodes : Silicon Graphics (SGI), et devient finalement Cray Inc.
Son métier est toujours celui des super-calculateurs, mais ils n’ont plus rien à voir avec le Cray XMP (photo ci-dessous) qui avait été acquis pas le Commissariat à l’Energie Atomique (CEA).
Aujourd’hui la société américaine emploie 1200 personnes, et a réalisé en 2015 un chiffre d’affaires de plus de 725 millions de dollars.

Le Big Data est passé par là, et Cray a développé une gamme de machines et un environnement logiciel spécialisé dans l’analyse de données. Cray annonce aujourd’hui la fusion des différentes machines développées précédemment : une plate-forme ouverte, qui s’appelle à partir d’aujourd’hui Cray Urika-GX.
Urika-GX est la combinaison d’une machine propriétaire et d’un environnement ouvert. Ouvert car en 2016, tous les data scientists veulent bâtir leur propre portefeuille de solutions, et exigent cette agilité. Cray cherche d’ailleurs avec cette gamme de machines, à réconcilier - tout autant que ce soit possible - les analystes de données et les départements informatique. Et si une véritable réconciliation est difficile, Cray tente au moins de respecter les contraintes des deux métiers.

Dominik Ulmer, VP Business Operations EMEA chez Cray
Dominik Ulmer, VP Business Operations EMEA chez Cray
Du point de vue matériel, Urika-GX est un super-calculateur. Aucun prix de nous a été communiqué, mais nous sommes forcément dans le haut de gamme : une armoire de 42U, jusqu’à 1728 coeurs par système, 22 To de RAM, 35 To en disques SSD, et 192 To de stockage sur disques durs magnétiques. Cette configuration maximum est bien sur réservée à des usages exceptionnels.

Du point de vue logiciel, le système fonctionne sur CentOS 7.2, une distribution de Linux, dont le noyau a été modifié par Cray pour optimiser les ressources de la machine. Sont disponibles les environnements de programmation traditionnels (Java, Scala, Python…) mais aussi un environnement de programmation propriétaire de Cray.
Les données peuvent être enregistrées en HDFS ou en Lustre, un système de fichiers distribué optimisé pour le calcul de haute performance.
Au-dessus de ces fichiers, les solutions Apache Hadoop, ou Apache Spark permettent d’accéder aux données; Mais Cray a également développé il y a quelques années une base de données orientée graphes, Cray Graph Engine, qu’il propose sur ce système. Par rapport à un grand fournisseur de solutions infonuagiques, qui pourrait bien être Amazon Web Services, Cray aurait constaté une division des temps de traitement par deux ou quatre (en fonction des tâches), sur l’utilisation de Spark. Par rapport à d’autres machines Big Data, l’utilisation de la base de données orientée graphes permettrait des gains allant jusqu’à vingt fois.

Alors que le marché des “appliances” semble avoir disparu au profit du cloud computing, Cray met en avant ses arguments pour défendre son choix.
Il ne s’agit pas d’une “appliance” dans le sens “boite noire””, explique Dominik Ulmer, VP Business Operations EMEA chez Cray. “Les entreprises pourront installer tout logiciel qu’ils souhaiteront utiliser à partir du moment où une version pour CentOS est disponible”. Mais il reconnaît également que ce type de configuration est adaptée à ceux qui ont un usage constant et régulier d’une telle puissance de calcul. Un client qui aurait des besoins très variables trouvera une meilleure réponse avec l’agilité du cloud.
La plate-forme Cray Urika-GX sera disponible dans les prochains mois. Elle est en test chez quelques clients, dont un dans le domaine des sciences de la vie (pour estimer l’espérance de vie des patients atteints de cancer) et un autre dans la cybersécurité (pour détecter au plus vite les tentatives d’intrusion sur les réseaux).




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store