VAST Data, la société spécialiste de plateforme de données pour l'ère de l'IA, a dévoilé sa nouvelle Vast Data Platform, une plateforme informatique de données transformative conçue pour être le fondement de la recherche assistée par l'IA. La VAST Data Platform est l'offre d'infrastructure de données globale de VAST, unifiant les services de stockage, de base de données et de moteur de calcul virtualisé dans un système évolutif qui a été conçu dès le départ pour l'avenir de l'IA et pour apporter du deep learning AI aux données. Cette nouvelle plateforme informatique globale définie par les données adopte une nouvelle approche pour réunir les données non structurées aux données structurées en stockant, traitant et distribuant ces données à partir d'un système unique et unifié.
La plateforme de données VAST est conçue en tenant compte de l'ensemble du spectre des données naturelles - types de données non structurées et structurées sous la forme de vidéos, d'images, de texte libre, de flux de données et de données d'instruments - générées dans le monde entier et traitées en temps réel par rapport à un corpus de données global. Cette approche vise à combler le fossé entre les architectures axées sur les événements et les architectures axées sur les données en offrant la possibilité :
D'accéder aux données et de les traiter dans n'importe quel centre de données en nuage privé ou public majeur
De comprendre les données naturelles en intégrant une couche sémantique interrogeable dans les données elles-mêmes.
De calculer continuellement et récursivement les données en temps réel, en évoluant avec chaque interaction.
"En encapsulant la capacité de créer et de cataloguer la compréhension à partir de données naturelles à l'échelle mondiale, nous consolidons des catégories entières d'infrastructure informatique pour permettre la prochaine ère de calcul de données à grande échelle. Avec VAST Data Platform, nous démocratisons les capacités d'IA et permettons aux organisations de libérer la véritable valeur de leurs données." a déclaré Renen Hallak, PDG et cofondateur de VAST Data. "Nous sommes enthousiastes à l'idée de dévoiler la première plateforme de données au monde construite à partir de la base pour la prochaine génération de découverte pilotée par l'IA, nous avons travaillé à ce moment depuis nos premiers jours."
Pour capturer et servir les données du monde naturel, VAST a d'abord conçu le fondement de sa plateforme, le VAST DataStore, une architecture de stockage évolutive pour les données non structurées qui élimine la hiérarchisation du stockage. Exposant des interfaces de stockage de fichiers d'entreprise et de stockage d'objets, le DataStore de VAST est une plate-forme de stockage en réseau d'entreprise conçue pour répondre aux besoins des puissantes architectures informatiques d'IA d'aujourd'hui, telles que les supercalculateurs d'IA NVIDIA DGX SuperPOD, ainsi que les plates-formes de big data et de HPC. Le DataStore à l'échelle du gigaoctet est conçu avec la meilleure efficacité système de sa catégorie pour apporter l'économie de l'archivage à l'infrastructure flash, ce qui le rend également adapté aux applications d'archivage. La résolution du problème du coût du stockage flash s'est avérée essentielle pour poser les bases du deep learning pour les entreprises qui cherchent à former des modèles sur leurs données propriétaires. À ce jour, VAST a géré plus de dix exaoctets de données à l'échelle mondiale avec des clients de premier plan tels que Booking.com, la NASA, Pixar Animation Studios, Zoom Video Communications, Inc. et bien d'autres.
Pour appliquer une structure aux données naturelles non structurées, VAST a ajouté une couche de base de données sémantique nativement dans le système avec l'introduction de la VAST DataBase. En appliquant les premiers principes de simplification des données structurées et en combinant les caractéristiques d'une base de données, d'un entrepôt de données et d'un lac de données dans un système de gestion de base de données simple, distribué et unifié, VAST a résolu les compromis entre les transactions (pour capturer et cataloguer les données naturelles en temps réel) et l'analytique (pour analyser et corréler les données en temps réel). Conçue pour une capture rapide des données et des requêtes rapides à toute échelle, la base de données VAST est le premier système à briser les barrières de l'analyse en temps réel, du flux d'événements jusqu'à l'archive.
Avec une base de données synthétisées structurées et non structurées, la VAST Data Platform permet ensuite d'affiner et d'enrichir les données brutes non structurées en informations structurées et interrogeables grâce à l'ajout de fonctions et de déclencheurs. Le VAST DataEngine est un moteur d'exécution de fonctions global qui consolide les centres de données et les régions en nuage en un cadre de calcul global. Le moteur prend en charge les langages de programmation les plus courants, tels que SQL et Python, et introduit un système de notification des événements ainsi qu'une formation matérialisée et reproductible des modèles qui facilite la gestion des pipelines d'IA.
Le dernier élément de la stratégie de VAST Data Platform est le VAST DataSpace, un espace global de noms qui permet à chaque site de stocker, d'extraire et de traiter des données à partir de n'importe quel endroit avec une haute performance tout en appliquant une cohérence stricte à travers chaque point d'accès. Avec le DataSpace, la VAST Data Platform peut être déployée dans des centres de données sur site, des environnements en périphérie et étend désormais l'accès au DataSpace aux principales plateformes de cloud public, notamment AWS, Microsoft Azure et Google Cloud.
Le DataStore, la DataBase et le DataSpace de VAST sont aujourd'hui généralement disponibles au sein de la plateforme de données de VAST, et le DataEngine de VAST sera disponible en 2024.
Depuis plus de sept ans, VAST construit une vision qui place les données - données naturelles, métadonnées riches, fonctions et déclencheurs - au centre de l'architecture des systèmes distribués VAST Disaggregated Shared-Everything (DASE). DASE pose les bases du deep learning en éliminant les compromis de performance, de capacité, d'échelle, de simplicité et de résilience afin de permettre l'apprentissage de modèles sur toutes les données d'une entreprise. En permettant aux clients d'ajouter de la logique au système, les machines peuvent continuellement et récursivement enrichir et comprendre les données du monde naturel.
La plateforme de données VAST est conçue en tenant compte de l'ensemble du spectre des données naturelles - types de données non structurées et structurées sous la forme de vidéos, d'images, de texte libre, de flux de données et de données d'instruments - générées dans le monde entier et traitées en temps réel par rapport à un corpus de données global. Cette approche vise à combler le fossé entre les architectures axées sur les événements et les architectures axées sur les données en offrant la possibilité :
D'accéder aux données et de les traiter dans n'importe quel centre de données en nuage privé ou public majeur
De comprendre les données naturelles en intégrant une couche sémantique interrogeable dans les données elles-mêmes.
De calculer continuellement et récursivement les données en temps réel, en évoluant avec chaque interaction.
"En encapsulant la capacité de créer et de cataloguer la compréhension à partir de données naturelles à l'échelle mondiale, nous consolidons des catégories entières d'infrastructure informatique pour permettre la prochaine ère de calcul de données à grande échelle. Avec VAST Data Platform, nous démocratisons les capacités d'IA et permettons aux organisations de libérer la véritable valeur de leurs données." a déclaré Renen Hallak, PDG et cofondateur de VAST Data. "Nous sommes enthousiastes à l'idée de dévoiler la première plateforme de données au monde construite à partir de la base pour la prochaine génération de découverte pilotée par l'IA, nous avons travaillé à ce moment depuis nos premiers jours."
Pour capturer et servir les données du monde naturel, VAST a d'abord conçu le fondement de sa plateforme, le VAST DataStore, une architecture de stockage évolutive pour les données non structurées qui élimine la hiérarchisation du stockage. Exposant des interfaces de stockage de fichiers d'entreprise et de stockage d'objets, le DataStore de VAST est une plate-forme de stockage en réseau d'entreprise conçue pour répondre aux besoins des puissantes architectures informatiques d'IA d'aujourd'hui, telles que les supercalculateurs d'IA NVIDIA DGX SuperPOD, ainsi que les plates-formes de big data et de HPC. Le DataStore à l'échelle du gigaoctet est conçu avec la meilleure efficacité système de sa catégorie pour apporter l'économie de l'archivage à l'infrastructure flash, ce qui le rend également adapté aux applications d'archivage. La résolution du problème du coût du stockage flash s'est avérée essentielle pour poser les bases du deep learning pour les entreprises qui cherchent à former des modèles sur leurs données propriétaires. À ce jour, VAST a géré plus de dix exaoctets de données à l'échelle mondiale avec des clients de premier plan tels que Booking.com, la NASA, Pixar Animation Studios, Zoom Video Communications, Inc. et bien d'autres.
Pour appliquer une structure aux données naturelles non structurées, VAST a ajouté une couche de base de données sémantique nativement dans le système avec l'introduction de la VAST DataBase. En appliquant les premiers principes de simplification des données structurées et en combinant les caractéristiques d'une base de données, d'un entrepôt de données et d'un lac de données dans un système de gestion de base de données simple, distribué et unifié, VAST a résolu les compromis entre les transactions (pour capturer et cataloguer les données naturelles en temps réel) et l'analytique (pour analyser et corréler les données en temps réel). Conçue pour une capture rapide des données et des requêtes rapides à toute échelle, la base de données VAST est le premier système à briser les barrières de l'analyse en temps réel, du flux d'événements jusqu'à l'archive.
Avec une base de données synthétisées structurées et non structurées, la VAST Data Platform permet ensuite d'affiner et d'enrichir les données brutes non structurées en informations structurées et interrogeables grâce à l'ajout de fonctions et de déclencheurs. Le VAST DataEngine est un moteur d'exécution de fonctions global qui consolide les centres de données et les régions en nuage en un cadre de calcul global. Le moteur prend en charge les langages de programmation les plus courants, tels que SQL et Python, et introduit un système de notification des événements ainsi qu'une formation matérialisée et reproductible des modèles qui facilite la gestion des pipelines d'IA.
Le dernier élément de la stratégie de VAST Data Platform est le VAST DataSpace, un espace global de noms qui permet à chaque site de stocker, d'extraire et de traiter des données à partir de n'importe quel endroit avec une haute performance tout en appliquant une cohérence stricte à travers chaque point d'accès. Avec le DataSpace, la VAST Data Platform peut être déployée dans des centres de données sur site, des environnements en périphérie et étend désormais l'accès au DataSpace aux principales plateformes de cloud public, notamment AWS, Microsoft Azure et Google Cloud.
Le DataStore, la DataBase et le DataSpace de VAST sont aujourd'hui généralement disponibles au sein de la plateforme de données de VAST, et le DataEngine de VAST sera disponible en 2024.
Depuis plus de sept ans, VAST construit une vision qui place les données - données naturelles, métadonnées riches, fonctions et déclencheurs - au centre de l'architecture des systèmes distribués VAST Disaggregated Shared-Everything (DASE). DASE pose les bases du deep learning en éliminant les compromis de performance, de capacité, d'échelle, de simplicité et de résilience afin de permettre l'apprentissage de modèles sur toutes les données d'une entreprise. En permettant aux clients d'ajouter de la logique au système, les machines peuvent continuellement et récursivement enrichir et comprendre les données du monde naturel.
Autres articles
-
PNY élargit son offre pour les entreprises avec la plateforme de données innovante VAST Data pour l'IA
-
La version 5.0 de la plateforme de Vast Data simplifie et sécurise la gestion des données dans le Cloud hybride et permet de réaliser 80 % d'économies sur le Cloud AWS
-
Lambda et Vast Data s'associent pour accélérer l'entraînement de l'IA dans les clouds publics et privés, en s'appuyant sur la technologie NVIDIA
-
G42 Cloud s'associe à Vast Data pour construire un cloud de données pour l’IA de plusieurs centaines de pétaoctets
-
Vast Data annonce un partenariat stratégique avec Hewlett Packard Enterprise pour intégrer sa solution logicielle dans HPE GreenLake for File Storage