Snowflake lance une nouvelle version de son connecteur Spark qui permet de traiter 14 fois plus rapidement les requêtes

Snowflake, la plateforme de données dans le cloud annonce le lancement de la version 2.6.0 du Snowflake Connector for Spark (Spark Connector) permettant d'utiliser le format de restitution en colonne Apache Arrow qui améliore considérablement les performances de lecture des requêtes. Cette évolution permet de rendre ces dernières jusqu’à quatorze fois plus performantes suivant l'utilisation des caches de données de Snowflake, elle aussi rendue possible par ce nouveau connecteur.

Cette nouvelle version du Snowflake Spark Connector exécute les requêtes directement via JDBC (Java Database Connectivity) et désérialise les données en utilisant Apache Arrow, le nouveau format de restitution des requêtes de Snowflake, côté client. Celui-ci permet de gagner du temps dans la lecture des données et d'utiliser les résultats des requêtes en cache. L'usage de ce nouveau connecteur apporte un gain de performance quatre fois supérieur pour les travaux de requêtage sur Spark de bout en bout par rapport à la version précédente. Cette amélioration est due à un gain de performance équivalent à 10 fois moins de temps passé par le connecteur Spark pour aller chercher et traiter les résultats de la requête Snowflake.

De plus, Snowflake dispose d'un cache de résultats de requêtes répétées. En stockant les résultats qui peuvent être réutilisés, la base de données peut éviter le recalcul et ordonner simplement au pilote du client de lire les résultats déjà calculés dans le cache. Dans les versions précédentes du Spark Connector, ce cache de résultats de requêtes n'était pas utilisable. C'est l'usage combiné du format Apache Arrow et du cash de requêtes qui permet au nouveau connecteur de multiplier les performances par 14.

Autres articles

Snowflake lance une nouvelle version de son connecteur Spark qui permet de traiter 14 fois plus rapidement les requêtes

La version 2.6.0 du Spark Connector de Snowflake permet d'utiliser le format de restitution Apache Arrow et les données de requêtes en cache de Snowflake pour augmenter considérablement les performances de traitement.

Qlik améliore l’intégration avec SAP, Databricks et Snowflake et favorise la création de valeur grâce à l’IA

Snowflake lance une initiative contre l’inégalité mondiale dans l’accès aux données

Snowflake veut faire l’acquisition de la plateforme d'intégration de données ouverte Datavolo

Snowflake accélère sa plateforme avec de nouvelles capacités pour aider les entreprises à simplifier les données et l'intelligence artificielle

Snowflake accélère la mise en production d’une IA fiable pour les entreprises

Qlik améliore l’intégration avec SAP, Databricks et Snowflake et favorise la création de valeur grâce à l’IA - 19/12/2024

Qlik lève les obstacles à la migration vers le cloud et ouvre la voie à une adoption transparente de l’IA dans tous les secteurs - 18/12/2024

Databricks lève 10 milliards de dollars dans une levée de fonds en Série J, avec une valorisation de 62 milliards de dollars - 18/12/2024

Boomi renforce ses capacités de gestion des données avec l'acquisition du fournisseur d'intégration de données Rivery - 18/12/2024

Comand AI lève 8,5 millions d'euros pour apporter une supériorité militaire décisive à la France et ses alliés - 16/12/2024