Starburst, la plateforme analytique du data lake, annonce avoir été nommée Outperforming Leader pour la deuxième année consécutive dans le Radar 2024 de GigaOm pour les Data Lakes et Lakehouses. Cette année, GigaOm a évalué dix fournisseurs du secteur et Starburst a été reconnue comme l'un des trois fournisseurs en position de leader/outperformer.
Selon le rapport de GigaOm, le moteur de requêtes SQL open source Trino renforce la plateforme Starburst et lui permet d’exceller dans le domaine de la fédération de requêtes et de l'analyse des données externes au data lake. Starburst peut se connecter à une grande variété de sources de données et les interroger, et son ingestion des données dans le lake en continu facilite l'analyse en temps quasi réel. Sa plateforme prend en charge les trois formats de table ouverts Apache Iceberg, Delta Lake et Apache Hudi, ainsi que le langage de programmation Python.
GigaOm souligne une évolution de la plateforme avec l’introduction de la couche de gouvernance Gravity pour Starburst Galaxy, qui renforce ses capacités de gouvernance et de catalogage des données. Ces nouvelles fonctionnalités comprennent des contrôles d'accès fins avec un étiquetage basé sur les attributs, un filtrage des lignes et un masquage des colonnes, qui permettent une application uniforme des politiques de sécurité dans toutes les régions de déploiement et à tous les niveaux où les données sont partagées.
Un autre point fort de Starburst mis en avant par GigaOm est sa couche de modélisation et de sémantique, dont les fonctionnalités de catalogage de données comprennent la création, la gestion et le partage des données en tant que produits. La fonctionnalité Data Products permet aux utilisateurs de fournir une documentation technique et métier pour un ensemble de données, d’y attacher des exemples de visualisation ou tableaux de bords liés aux données, d'afficher l'historique et les cas d'utilisation cibles. Elle permet ainsi aux utilisateurs métiers d'interagir avec un Data Product de Starburst, de comprendre son contexte et son utilisation et de le partager avec d'autres utilisateurs internes ou externes.
D’après GigaOm : “Grâce à son architecture de traitement massivement parallèle (MPP), Starburst est une solution hautement évolutive. Sa plateforme est polyvalente car elle comprend de nombreuses fonctionnalités qui facilitent le travail des data engineers, des data scientists et des data analysts, ainsi que des capacités qui aident les utilisateurs métiers à interagir avec les données, à les comprendre et à collaborer entre eux. L'écosystème de la plateforme Starburst comprend des outils et des plateformes open source et propriétaires couvrant toute la gamme d'une architecture de données moderne, y compris des outils de visualisation, des outils ETL/ELT, des fournisseurs de système de sécurité et de contrôle d'accès, des fournisseurs de catalogues de données et des outils tiers d'IA et de Machine Learning.”
Selon le rapport de GigaOm, le moteur de requêtes SQL open source Trino renforce la plateforme Starburst et lui permet d’exceller dans le domaine de la fédération de requêtes et de l'analyse des données externes au data lake. Starburst peut se connecter à une grande variété de sources de données et les interroger, et son ingestion des données dans le lake en continu facilite l'analyse en temps quasi réel. Sa plateforme prend en charge les trois formats de table ouverts Apache Iceberg, Delta Lake et Apache Hudi, ainsi que le langage de programmation Python.
GigaOm souligne une évolution de la plateforme avec l’introduction de la couche de gouvernance Gravity pour Starburst Galaxy, qui renforce ses capacités de gouvernance et de catalogage des données. Ces nouvelles fonctionnalités comprennent des contrôles d'accès fins avec un étiquetage basé sur les attributs, un filtrage des lignes et un masquage des colonnes, qui permettent une application uniforme des politiques de sécurité dans toutes les régions de déploiement et à tous les niveaux où les données sont partagées.
Un autre point fort de Starburst mis en avant par GigaOm est sa couche de modélisation et de sémantique, dont les fonctionnalités de catalogage de données comprennent la création, la gestion et le partage des données en tant que produits. La fonctionnalité Data Products permet aux utilisateurs de fournir une documentation technique et métier pour un ensemble de données, d’y attacher des exemples de visualisation ou tableaux de bords liés aux données, d'afficher l'historique et les cas d'utilisation cibles. Elle permet ainsi aux utilisateurs métiers d'interagir avec un Data Product de Starburst, de comprendre son contexte et son utilisation et de le partager avec d'autres utilisateurs internes ou externes.
D’après GigaOm : “Grâce à son architecture de traitement massivement parallèle (MPP), Starburst est une solution hautement évolutive. Sa plateforme est polyvalente car elle comprend de nombreuses fonctionnalités qui facilitent le travail des data engineers, des data scientists et des data analysts, ainsi que des capacités qui aident les utilisateurs métiers à interagir avec les données, à les comprendre et à collaborer entre eux. L'écosystème de la plateforme Starburst comprend des outils et des plateformes open source et propriétaires couvrant toute la gamme d'une architecture de données moderne, y compris des outils de visualisation, des outils ETL/ELT, des fournisseurs de système de sécurité et de contrôle d'accès, des fournisseurs de catalogues de données et des outils tiers d'IA et de Machine Learning.”
Autres articles
-
Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg
-
Starburst nomme Deron Miller vice-président senior et directeur général Amériques et APAC
-
Starburst nomme Steve Williamson au poste de directeur général EMEA
-
Starburst intègre le support du catalogue Polaris pour Apache Iceberg
-
Starburst lance de nouvelles fonctionnalités pour optimiser l’utilisation d’un Data Lakehouse/Icehouse et la qualité des données