Neo4j lance le nouveau connecteur Apache Spark

Grâce au connecteur Neo4j pour Apache Spark, les utilisateurs peuvent fusionner des données Spark avec des données de graphes Neo4j pour répondre à davantage de questions, obtenir de nouvelles perspectives et créer de nouvelles solutions.

Neo4jⓇ, le leader de la technologie des graphes, annonce la disponibilité du connecteur Neo4j pour Apache Spark, un outil d'intégration qui permet de déplacer les données dans les deux sens entre la plateforme de données de graphes de Neo4j et Apache Spark™.

Apache Spark est la couche d'orchestration des données de prédilection pour les entreprises, en particulier dans les circuits de données complexes caractéristiques des applications d'apprentissage automatique et d'analytique prédictive. Le connecteur Neo4j pour Apache Spark permet un accès facile et bidirectionnel entre les ensembles de données de graphes de Neo4j et de nombreuses autres sources de données, notamment les bases de données relationnelles et les référentiels semi-structurés et non-structurés (NoSQL). Il convertit les tableaux de données en graphes et fait la conversion inverse selon les besoins. Ce nouveau connecteur disponible gratuitement est entièrement pris en charge pour les clients de Neo4j.

Le connecteur Neo4j pour Apache Spark apporte une réponse à la demande des communautés Spark et Neo4j d'intégrer les graphes aux systèmes d'apprentissage automatique, pour unifier les silos de données et pour tirer une plus grande valeur ajoutée des bases de données existantes. Selon l'étude indépendante, "Graphes de connaissances : les priorités des directeurs IT" récemment menée par Pulse, les trois principales raisons qui motivent les décideurs informatiques des entreprises à étendre leur utilisation des graphes de connaissance sont l'amélioration des systèmes d'apprentissage automatique et d'intelligence artificielle (60%), la création de nouvelles sources de revenus (50%) et la connexion données cloisonnées pour que l'information devienne plus accessible (50%).

Pour les clients de Neo4j : le connecteur Neo4j pour Apache Spark connecte les données de graphes Neo4j à un ensemble plus large de données dans l'écosystème Spark. Le connecteur Spark convertit les sources de données tabulaires en données de graphes afin de mettre en évidence davantage de contexte et de perspectives dans Neo4j. Grâce à l'intégration bidirectionnelle, Spark peut nettoyer et convertir les données avec lesquelles fonctionnent les applications basées sur les graphes Neo4j et réinjecter ces données de graphes dans tout workflow Spark.

Pour les utilisateurs de Spark : le connecteur Neo4j pour Apache Spark introduit des capacités avancées des graphes dans l'écosystème Spark afin que les entreprises puissent utiliser des informations contextuelles pour améliorer les projections, l'analytique et les prévisions. Grâce à ce connecteur, les équipes peuvent ajouter facilement des données de graphes à des tâches à forte valeur ajoutée telles que l'apprentissage automatique, sans avoir à retravailler les circuits existants.

Amy E. Hodler, Director of Graph Analytics and AI Programs chez Neo4j, explique les raisons de l'engouement des clients pour une connexion entre Neo4j et Spark.
« Dans leur grande majorité, les entreprises clientes de Neo4j disposent d'Apache Stark dans leur environnement de données, » indique Amy E. Holder. « Avec le connecteur Neo4j pour Apache Spark, nos clients consolident leurs circuits de données et étoffent leurs données de graphes Neo4j en accédant au vaste écosystème de Spark. Ce connecteur permet aux data scientists et aux développeurs d'applications de fusionner facilement les données de graphes de Neo4j avec les données Spark pour répondre à davantage de questions, obtenir de nouvelles perspectives et créer de nouvelles solutions. »

En janvier, Gartner a publié An Introduction to and Evaluation of Apache Spark for Modern Data Architectures*, rapport qui présente et évalue Apache Spark dans les architectures modernes de données. Selon ce rapport, « Spark est devenu une plateforme de production viable pour répondre aux attentes des entreprises. Pour les développeurs, elle est facile à comprendre et à utiliser pour développer des solutions. Spark a aussi développé une communauté dynamique de contributeurs et de solutions. L'architecture de Spark et la facilité avec laquelle elle peut être utilisée pour ingérer, traiter et analyser des workloads opérationnels ou des analytiques lui permettent de réduire les délais entre l'entrée de données et la production de perspectives. »

*Gartner, An Introduction to and Evaluation of Apache Spark for Modern Data Architectures, Sanjeev Mohan & Sumit Pal, 14 janvier 2020.

Autres articles

Neo4j lance le nouveau connecteur Apache Spark

Ce connecteur ouvre le vaste écosystème Spark à la technologie des graphes de Neo4j.

Apache Kafka : 15 ans pour réconcilier la technique et le métier

Starburst étend les data products Iceberg aux environnements on-premises et hybrides

Neo4j lance Infinigraph: la base de données de graphes la plus scalable pour unifier les charges opérationnelles et analytiques à l’échelle de 100 To+

Snowflake lance Snowpark Connect pour Apache Spark

Neo4j lance la première offre d'analyse de graphes compatible avec toutes les plateformes de données

MongoDB étend ses capacités de recherche et de recherche vectorielle à ses offres autogérées - 20/09/2025

Neo4j lance Infinigraph: la base de données de graphes la plus scalable pour unifier les charges opérationnelles et analytiques à l’échelle de 100 To+ - 04/09/2025

MongoDB renforce sa plateforme et son écosystème pour les applications IA - 28/08/2025

Hallucinations IA : comment l'infrastructure de stockage transforme la fiabilité de l'intelligence artificielle - 17/07/2025

Trois raisons pour lesquelles des bases de données sécurisées et fiables sont essentielles pour les banques françaises - 17/07/2025