Le Cray XMP de 1984 présenté au musée de l'informatique
S'il est un constructeur qui historiquement mériterait d'être le leader du concept de "big data" c'est bien Cray. Qui en 1972, sous la conduite de son fondateur Seymour Cray, inventa les super-calculateurs, utilisés pendant plusieurs décennies par des clients précurseurs chez qui l'évocation aujourd'hui du "big data" fait poindre un sourire convenu.
Lorsque le laboratoire de Los Alamos s'équipe en 1976 d'un Cray 1, lorsqu'en 1984 le Commissariat à l'Energie Atomique (CEA) dépense plusieurs millions de dollars pour obtenir, difficilement, un Cray XMP; la notion de big data n'est pas encore née, mais elle est une réalité pour ces premiers clients.
Après plusieurs péripéties, dont le rachat par Silicon Graphics, Cray a repris son indépendance, et depuis 1995 est de nouveau cotée en bourse. Et l'entreprise a récupéré ses activités de recherche, et son nom, en 2000. Fabricant de super-calculateurs Cray ne pouvait pas rester à l'écart de ce marché naissant des très gros volumes de données.
En février dernier, Cray annonce la création d'une division dédiée à ce nouveau marché, YarcData. Et YarcData annonce quelques semaines après la mise en marché d'une "appliance" dédiée à l'analyse graphique de gros volumes de données.
Stratégie originale et en rupture de Cray qui, plutôt que de se heurter en direct à Teradata, Netezza, Oracle…, choisit une niche et y apporte une expertise nouvelle.
Cette machine s'appelle uRiKa (désolé, mais nous ne cèderons pas ici au marketing de Cray et l'appelleront Urika). Elle propose d'analyser les relations entre des volumes importants de données. Pas les relations évidentes qu'une base de données relationnelle pourrait aisément modéliser, mais les relations à découvrir dans des jeux de données a priori sans liens. Et Urika propose de stocker et représenter ces relations sous forme graphique, permettant ainsi une navigation plus intuitive.
D'un point de vue technologique, Urika est équipée (il me semble que la machine est féminine) de processeurs conçus par Cray, fonctionnant sur une architecture massivement parallèle.
La notion de graphique n'est pas limitée à la représentation des données. Urika s'appuie sur une base de données graphique.
Une base de données graphique est une base dans laquelle chaque élément pointe directement vers les éléments auxquels il est lié, sans passer par un index. Cette structure permet une navigation et une analyse bien plus rapide des relations entre les éléments de la base.
On trouve sur Wikipedia une liste des bases de données graphiques.
Les bases de données graphiques permettent de résoudre des problèmes dans le domaine de la santé, des télécommunications, des sciences de la vie… Les "data scientists" de ces secteurs profiteront de la puissance d'analyse proposée par YarcData.
Optimisée pour ce type de données, Urika construit plutôt un entrepôt de relations (Relationship Warehouse) qu'un entrepôt de données (Data Warehouse).
Outre le stockage de nombreuses relations, le facteur réactivité est important, et Urika propose de réaliser l'ensemble des recherches en temps réel dans la base de données graphique.
Pour faire rêver les passionnés de technologies, voici quelques données techniques sur cette nouvelle machine :
- Jusqu'à 512 To de mémoire centrale
- Des processeurs Cray supportant jusqu'à 128 tâches en parallèle
- Des systèmes d'entrée-sortie permettant d'ingérer jusqu'à 350 To de données par heure
L'ensemble fonctionne sous Linux SuSe.
Le prix ? Aucune idée… Si le constructeur me transmet une réponse, nous l'ajouterons en commentaire. Mais il est facile d'imaginer que seuls les quelques lecteurs de Decideo qui ont les moyens de financer l'acquisition de ce type de machine sont également capables d'en imaginer le prix !
Pour YarcData, l'appliance Urika n'a pas vocation à concurrencer un entrepôt de données classique, ni une grappe de machines Hadoop, mais d'ajouter à ces architectures un potentiel supplémentaire en matière de navigation dans les relations entre les données.
A noter que la division YarcData est dirigée par Arvind Parthasarathi, un ancien de Informatica et de I2 Technologies.
Lorsque le laboratoire de Los Alamos s'équipe en 1976 d'un Cray 1, lorsqu'en 1984 le Commissariat à l'Energie Atomique (CEA) dépense plusieurs millions de dollars pour obtenir, difficilement, un Cray XMP; la notion de big data n'est pas encore née, mais elle est une réalité pour ces premiers clients.
Après plusieurs péripéties, dont le rachat par Silicon Graphics, Cray a repris son indépendance, et depuis 1995 est de nouveau cotée en bourse. Et l'entreprise a récupéré ses activités de recherche, et son nom, en 2000. Fabricant de super-calculateurs Cray ne pouvait pas rester à l'écart de ce marché naissant des très gros volumes de données.
En février dernier, Cray annonce la création d'une division dédiée à ce nouveau marché, YarcData. Et YarcData annonce quelques semaines après la mise en marché d'une "appliance" dédiée à l'analyse graphique de gros volumes de données.
Stratégie originale et en rupture de Cray qui, plutôt que de se heurter en direct à Teradata, Netezza, Oracle…, choisit une niche et y apporte une expertise nouvelle.
Cette machine s'appelle uRiKa (désolé, mais nous ne cèderons pas ici au marketing de Cray et l'appelleront Urika). Elle propose d'analyser les relations entre des volumes importants de données. Pas les relations évidentes qu'une base de données relationnelle pourrait aisément modéliser, mais les relations à découvrir dans des jeux de données a priori sans liens. Et Urika propose de stocker et représenter ces relations sous forme graphique, permettant ainsi une navigation plus intuitive.
D'un point de vue technologique, Urika est équipée (il me semble que la machine est féminine) de processeurs conçus par Cray, fonctionnant sur une architecture massivement parallèle.
La notion de graphique n'est pas limitée à la représentation des données. Urika s'appuie sur une base de données graphique.
Une base de données graphique est une base dans laquelle chaque élément pointe directement vers les éléments auxquels il est lié, sans passer par un index. Cette structure permet une navigation et une analyse bien plus rapide des relations entre les éléments de la base.
On trouve sur Wikipedia une liste des bases de données graphiques.
Les bases de données graphiques permettent de résoudre des problèmes dans le domaine de la santé, des télécommunications, des sciences de la vie… Les "data scientists" de ces secteurs profiteront de la puissance d'analyse proposée par YarcData.
Optimisée pour ce type de données, Urika construit plutôt un entrepôt de relations (Relationship Warehouse) qu'un entrepôt de données (Data Warehouse).
Outre le stockage de nombreuses relations, le facteur réactivité est important, et Urika propose de réaliser l'ensemble des recherches en temps réel dans la base de données graphique.
Pour faire rêver les passionnés de technologies, voici quelques données techniques sur cette nouvelle machine :
- Jusqu'à 512 To de mémoire centrale
- Des processeurs Cray supportant jusqu'à 128 tâches en parallèle
- Des systèmes d'entrée-sortie permettant d'ingérer jusqu'à 350 To de données par heure
L'ensemble fonctionne sous Linux SuSe.
Le prix ? Aucune idée… Si le constructeur me transmet une réponse, nous l'ajouterons en commentaire. Mais il est facile d'imaginer que seuls les quelques lecteurs de Decideo qui ont les moyens de financer l'acquisition de ce type de machine sont également capables d'en imaginer le prix !
Pour YarcData, l'appliance Urika n'a pas vocation à concurrencer un entrepôt de données classique, ni une grappe de machines Hadoop, mais d'ajouter à ces architectures un potentiel supplémentaire en matière de navigation dans les relations entre les données.
A noter que la division YarcData est dirigée par Arvind Parthasarathi, un ancien de Informatica et de I2 Technologies.