Grâce au connecteur Neo4j pour Apache Spark, les utilisateurs peuvent fusionner des données Spark avec des données de graphes Neo4j pour répondre à davantage de questions, obtenir de nouvelles perspectives et créer de nouvelles solutions.
Neo4jⓇ, le leader de la technologie des graphes, annonce la disponibilité du connecteur Neo4j pour Apache Spark, un outil d'intégration qui permet de déplacer les données dans les deux sens entre la plateforme de données de graphes de Neo4j et Apache Spark™.
Apache Spark est la couche d'orchestration des données de prédilection pour les entreprises, en particulier dans les circuits de données complexes caractéristiques des applications d'apprentissage automatique et d'analytique prédictive. Le connecteur Neo4j pour Apache Spark permet un accès facile et bidirectionnel entre les ensembles de données de graphes de Neo4j et de nombreuses autres sources de données, notamment les bases de données relationnelles et les référentiels semi-structurés et non-structurés (NoSQL). Il convertit les tableaux de données en graphes et fait la conversion inverse selon les besoins. Ce nouveau connecteur disponible gratuitement est entièrement pris en charge pour les clients de Neo4j.
Le connecteur Neo4j pour Apache Spark apporte une réponse à la demande des communautés Spark et Neo4j d'intégrer les graphes aux systèmes d'apprentissage automatique, pour unifier les silos de données et pour tirer une plus grande valeur ajoutée des bases de données existantes. Selon l'étude indépendante, "Graphes de connaissances : les priorités des directeurs IT" récemment menée par Pulse, les trois principales raisons qui motivent les décideurs informatiques des entreprises à étendre leur utilisation des graphes de connaissance sont l'amélioration des systèmes d'apprentissage automatique et d'intelligence artificielle (60%), la création de nouvelles sources de revenus (50%) et la connexion données cloisonnées pour que l'information devienne plus accessible (50%).
Pour les clients de Neo4j : le connecteur Neo4j pour Apache Spark connecte les données de graphes Neo4j à un ensemble plus large de données dans l'écosystème Spark. Le connecteur Spark convertit les sources de données tabulaires en données de graphes afin de mettre en évidence davantage de contexte et de perspectives dans Neo4j. Grâce à l'intégration bidirectionnelle, Spark peut nettoyer et convertir les données avec lesquelles fonctionnent les applications basées sur les graphes Neo4j et réinjecter ces données de graphes dans tout workflow Spark.
Pour les utilisateurs de Spark : le connecteur Neo4j pour Apache Spark introduit des capacités avancées des graphes dans l'écosystème Spark afin que les entreprises puissent utiliser des informations contextuelles pour améliorer les projections, l'analytique et les prévisions. Grâce à ce connecteur, les équipes peuvent ajouter facilement des données de graphes à des tâches à forte valeur ajoutée telles que l'apprentissage automatique, sans avoir à retravailler les circuits existants.
Amy E. Hodler, Director of Graph Analytics and AI Programs chez Neo4j, explique les raisons de l'engouement des clients pour une connexion entre Neo4j et Spark.
« Dans leur grande majorité, les entreprises clientes de Neo4j disposent d'Apache Stark dans leur environnement de données, » indique Amy E. Holder. « Avec le connecteur Neo4j pour Apache Spark, nos clients consolident leurs circuits de données et étoffent leurs données de graphes Neo4j en accédant au vaste écosystème de Spark. Ce connecteur permet aux data scientists et aux développeurs d'applications de fusionner facilement les données de graphes de Neo4j avec les données Spark pour répondre à davantage de questions, obtenir de nouvelles perspectives et créer de nouvelles solutions. »
En janvier, Gartner a publié An Introduction to and Evaluation of Apache Spark for Modern Data Architectures*, rapport qui présente et évalue Apache Spark dans les architectures modernes de données. Selon ce rapport, « Spark est devenu une plateforme de production viable pour répondre aux attentes des entreprises. Pour les développeurs, elle est facile à comprendre et à utiliser pour développer des solutions. Spark a aussi développé une communauté dynamique de contributeurs et de solutions. L'architecture de Spark et la facilité avec laquelle elle peut être utilisée pour ingérer, traiter et analyser des workloads opérationnels ou des analytiques lui permettent de réduire les délais entre l'entrée de données et la production de perspectives. »
*Gartner, An Introduction to and Evaluation of Apache Spark for Modern Data Architectures, Sanjeev Mohan & Sumit Pal, 14 janvier 2020.
Apache Spark est la couche d'orchestration des données de prédilection pour les entreprises, en particulier dans les circuits de données complexes caractéristiques des applications d'apprentissage automatique et d'analytique prédictive. Le connecteur Neo4j pour Apache Spark permet un accès facile et bidirectionnel entre les ensembles de données de graphes de Neo4j et de nombreuses autres sources de données, notamment les bases de données relationnelles et les référentiels semi-structurés et non-structurés (NoSQL). Il convertit les tableaux de données en graphes et fait la conversion inverse selon les besoins. Ce nouveau connecteur disponible gratuitement est entièrement pris en charge pour les clients de Neo4j.
Le connecteur Neo4j pour Apache Spark apporte une réponse à la demande des communautés Spark et Neo4j d'intégrer les graphes aux systèmes d'apprentissage automatique, pour unifier les silos de données et pour tirer une plus grande valeur ajoutée des bases de données existantes. Selon l'étude indépendante, "Graphes de connaissances : les priorités des directeurs IT" récemment menée par Pulse, les trois principales raisons qui motivent les décideurs informatiques des entreprises à étendre leur utilisation des graphes de connaissance sont l'amélioration des systèmes d'apprentissage automatique et d'intelligence artificielle (60%), la création de nouvelles sources de revenus (50%) et la connexion données cloisonnées pour que l'information devienne plus accessible (50%).
Pour les clients de Neo4j : le connecteur Neo4j pour Apache Spark connecte les données de graphes Neo4j à un ensemble plus large de données dans l'écosystème Spark. Le connecteur Spark convertit les sources de données tabulaires en données de graphes afin de mettre en évidence davantage de contexte et de perspectives dans Neo4j. Grâce à l'intégration bidirectionnelle, Spark peut nettoyer et convertir les données avec lesquelles fonctionnent les applications basées sur les graphes Neo4j et réinjecter ces données de graphes dans tout workflow Spark.
Pour les utilisateurs de Spark : le connecteur Neo4j pour Apache Spark introduit des capacités avancées des graphes dans l'écosystème Spark afin que les entreprises puissent utiliser des informations contextuelles pour améliorer les projections, l'analytique et les prévisions. Grâce à ce connecteur, les équipes peuvent ajouter facilement des données de graphes à des tâches à forte valeur ajoutée telles que l'apprentissage automatique, sans avoir à retravailler les circuits existants.
Amy E. Hodler, Director of Graph Analytics and AI Programs chez Neo4j, explique les raisons de l'engouement des clients pour une connexion entre Neo4j et Spark.
« Dans leur grande majorité, les entreprises clientes de Neo4j disposent d'Apache Stark dans leur environnement de données, » indique Amy E. Holder. « Avec le connecteur Neo4j pour Apache Spark, nos clients consolident leurs circuits de données et étoffent leurs données de graphes Neo4j en accédant au vaste écosystème de Spark. Ce connecteur permet aux data scientists et aux développeurs d'applications de fusionner facilement les données de graphes de Neo4j avec les données Spark pour répondre à davantage de questions, obtenir de nouvelles perspectives et créer de nouvelles solutions. »
En janvier, Gartner a publié An Introduction to and Evaluation of Apache Spark for Modern Data Architectures*, rapport qui présente et évalue Apache Spark dans les architectures modernes de données. Selon ce rapport, « Spark est devenu une plateforme de production viable pour répondre aux attentes des entreprises. Pour les développeurs, elle est facile à comprendre et à utiliser pour développer des solutions. Spark a aussi développé une communauté dynamique de contributeurs et de solutions. L'architecture de Spark et la facilité avec laquelle elle peut être utilisée pour ingérer, traiter et analyser des workloads opérationnels ou des analytiques lui permettent de réduire les délais entre l'entrée de données et la production de perspectives. »
*Gartner, An Introduction to and Evaluation of Apache Spark for Modern Data Architectures, Sanjeev Mohan & Sumit Pal, 14 janvier 2020.
Autres articles
-
La nouvelle plateforme Confluent pour Apache Flink facilite la gestion et la sécurisation du traitement de flux haute performance on-premises
-
Neo4j dépasse les 200 millions de dollars de chiffre d’affaires et accélère son leadership dans le domaine de la GenAI grâce à sa technologie de graphes
-
Neo4j transforme son portefeuille de bases de données cloud pour accélérer l'adoption des graphes et de l’IA générative en entreprise
-
Starburst intègre le support du catalogue Polaris pour Apache Iceberg
-
Podcast : La donnée sous tous les angles, avec Philippe Charpentier, CTO de NetApp France