Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg

Starburst, la société derrière Trino, annonce une série de nouvelles fonctionnalités pour Galaxy, sa plateforme lakehouse SaaS hybride et ouverte, basée sur le projet open source Trino. Les nouvelles capacités annoncées permettent à la fois l'ingestion en streaming entièrement gérée depuis Apache Kafka vers des tables Apache Iceberg, l'ingestion automatique de fichiers depuis Amazon Web Services (AWS) S3 vers des tables Iceberg, ainsi que de nombreuses améliorations en matière de performance et d’optimisation du rapport performance/prix de la plateforme lakehouse.

« Grâce à nos nouvelles capacités d’ingestion vers Iceberg, nos clients n'ont plus à se préoccuper de la quantité ou de la vitesse des données entrantes dans leurs data lakes », déclare Tobias Ternstrom, Chief Product Officer chez Starburst. « Avec une ingestion de 100 Gb/s, Galaxy répond aux besoins les plus exigeants, sans coûts excessifs ni contraintes de configuration. »

Starburst Galaxy intègre l’ingestion en continu depuis Kafka, qui permet aux entreprises de configurer en quelques minutes des pipelines entièrement gérés pour transférer les données de Kafka vers Iceberg. Compatible avec des systèmes conformes à Kafka, tels que Confluent Cloud et Amazon MSK, cette solution assure un traitement fiable à un débit de 100 Gb par seconde, sans doublons ni pertes de données. Pour les utilisateurs d’Amazon S3, Starburst proposera également une ingestion automatisée de fichiers, qui optimise les performances de lecture grâce à des opérations automatiques de compaction et de gestion des snapshots, rendant les données disponibles pour les requêtes en une minute environ.

Starburst a également enrichi les capacités d’auto-scaling de Galaxy pour une gestion intelligente des ressources dans les environnements à forte concurrence d’utilisateurs, où les besoins en calcul fluctuent constamment. Désormais, Galaxy surveille les requêtes actives et en attente, ce qui permet une allocation de ressources 50 % plus rapide par requête. Le système peut également réactiver automatiquement les nœuds de calcul en fin de cycle pour optimiser l’efficacité.

La nouvelle génération de cache de Starburst Galaxy est conçue pour alléger les tâches de préparation de données souvent fastidieuses pour les data engineers, en améliorant la performance des requêtes jusqu’à 62 %. Basée sur la technologie Warp Speed, elle automatise une partie des processus et permet de gérer efficacement la montée en charge et la stabilité des requêtes pour les outils de BI et de dashboarding. Warp Speed utilise une indexation intelligente et une mise en cache avancée pour optimiser les résultats intermédiaires des charges de travail et identifier les motifs de sous-requêtes similaires.

La fonctionnalité de routage basé sur les rôles utilisateurs de Starburst Galaxy simplifie l’allocation des ressources selon le type de cluster. Les utilisateurs n’ont plus besoin de choisir le cluster adapté pour chaque requête et les administrateurs peuvent désormais affecter facilement des groupes en fonction des rôles et privilèges. Ce routage automatisé dirige les requêtes vers le cluster approprié selon des règles prédéfinies, le tout via une URL unique, limitant ainsi les interventions manuelles et optimisant l’efficacité des opérations.

« Dans une économie numérique en quête de performances d’analyses optimisées et de coûts maîtrisés, Starburst répond à un besoin crucial : fournir une ingestion de données en continu simple, évolutive, et basée sur des standards ouverts comme Apache Iceberg, » explique Sanjeev Mohan, fondateur de SanjMo. « Cette innovation de Starburst est une avancée majeure pour les entreprises en quête de scalabilité, de simplicité et d’optimisation budgétaire. »

Autres articles

Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg

La plateforme de Starburst permet de passer de l’ingestion de données à des analyses SQL en temps quasi réel.

Starburst nomme Lisa Luscap, experte en marketing des données et des technologies, au poste de Chief Marketing Officer

HSBC optimise son accès aux données et son efficacité opérationnelle grâce à la technologie Starburst

Du Big Data au Better Data : 5 tendances stratégiques pour 2025 selon Starburst

Starburst nomme Deron Miller vice-président senior et directeur général Amériques et APAC

Starburst nomme Steve Williamson au poste de directeur général EMEA

BNP Paribas signe un partenariat avec Oracle pour renforcer sa stratégie cloud - 09/01/2025

Snowflake renforce la collaboration cross-cloud pour les données d'entreprise et l'intelligence artificielle - 21/11/2024

Snowflake unifie les données transactionnelles et analytiques avec la disponibilité générale des Hybrid Tables - 21/11/2024

Neo4j dépasse les 200 millions de dollars de chiffre d’affaires et accélère son leadership dans le domaine de la GenAI grâce à sa technologie de graphes - 20/11/2024

Se préparer à l’avenir des moteurs de recherche avec l’approche vectorielle - 22/10/2024