Fournisseur de solutions analytiques modernes, Pentaho Corporation, annonce l'intégration native de Pentaho Data Integration (PDI) à Apache Spark™, permettant ainsi l'orchestration des tâches Spark. Développée à l’initiative de Pentaho Labs, cette intégration permettra aux clients d'améliorer leur productivité, de minimiser leurs coûts de maintenance et de considérablement réduire les niveaux de compétence requis, dès lors que Spark est inclus dans des projets Big Data.
Spark est un moteur de traitement open source puissant axé sur la vitesse, la facilité d'utilisation et le Machine Learning. Entièrement conçue pour offrir des hautes performances, la technologie Big Data de nouvelle génération Spark permet de facilement stocker, croiser et contrôler les données à une vitesse et à une échelle inégalées. Reposant sur un socle open source complémentaire, elle a permis à Pentaho d’être un des premiers à innover avec cette technologie Big Data émergente.
« Pendant deux ans, nous avons testé des cas d'utilisation en nous basant sur nos projets Big Data types et avons évalué le marché des entreprises pour Spark. Nos clients peuvent à présent tirer parti de ce travail grâce à des fonctions analytiques temps réel simplifiées, » déclare James Dixon, Chief Technology Officer, Pentaho. « Notre héritage open source et notre plateforme moderne extensible nous ont permis de faire rapidement évoluer nos capacités, ce qui laisse à nos clients une grand choix de technologies Big Data, réduit les risques et délais de développement tout en tirant profit des dernières innovations des entrepôts Big Data les plus utilisés. »
Les technologies Big Data évoluant à un rythme effréné, l'équipe de Pentaho Labs continue d'exploiter et d’influencer l'innovation en matière d'analyse et d'intégration des Big Data, ce qui permet aux clients de déployer des projets Big Data en toute sécurité. L'intégration de Spark s'inscrit dans la lignée d'autres initiatives telles que la prise en charge de YARN et du composant Adaptive Big Data Layer. Suite à la prise en charge native de YARN, des entreprises telles que RichRelevance, edo Interactive et MultiPlan ont pu innover et générer plus valeur ajoutée en utilisant Hadoop.
« Avec une haute performance, un traitement des données en mémoire et de nombreux modèles de calcul, Apache Spark est la solution idéale pour alimenter les plateformes de traitement des données de nouvelle génération, » explique Matt Aslett, directeur de la recherche, plateformes de données et analytique, 451 Research. « L'intégration à Spark montre parfaitement, comment l’approche open source de Pentaho lui permet de répondre aux technologies émergentes qui gagnent de l’importance sur le marché des Big Data en perpétuelle évolution, et de les intégrer avec sa plateforme de gestion des données et analytique. »
Disponibilité
Pentaho Data Integration pour Apache Spark est actuellement disponible au sein de Pentaho Labs. Sa disponibilité générale est prévue en Juin 2015. Pour en savoir davantage sur les innovations de Pentaho Labs, visitez : http://www.pentaho.com/labs.
Spark est un moteur de traitement open source puissant axé sur la vitesse, la facilité d'utilisation et le Machine Learning. Entièrement conçue pour offrir des hautes performances, la technologie Big Data de nouvelle génération Spark permet de facilement stocker, croiser et contrôler les données à une vitesse et à une échelle inégalées. Reposant sur un socle open source complémentaire, elle a permis à Pentaho d’être un des premiers à innover avec cette technologie Big Data émergente.
« Pendant deux ans, nous avons testé des cas d'utilisation en nous basant sur nos projets Big Data types et avons évalué le marché des entreprises pour Spark. Nos clients peuvent à présent tirer parti de ce travail grâce à des fonctions analytiques temps réel simplifiées, » déclare James Dixon, Chief Technology Officer, Pentaho. « Notre héritage open source et notre plateforme moderne extensible nous ont permis de faire rapidement évoluer nos capacités, ce qui laisse à nos clients une grand choix de technologies Big Data, réduit les risques et délais de développement tout en tirant profit des dernières innovations des entrepôts Big Data les plus utilisés. »
Les technologies Big Data évoluant à un rythme effréné, l'équipe de Pentaho Labs continue d'exploiter et d’influencer l'innovation en matière d'analyse et d'intégration des Big Data, ce qui permet aux clients de déployer des projets Big Data en toute sécurité. L'intégration de Spark s'inscrit dans la lignée d'autres initiatives telles que la prise en charge de YARN et du composant Adaptive Big Data Layer. Suite à la prise en charge native de YARN, des entreprises telles que RichRelevance, edo Interactive et MultiPlan ont pu innover et générer plus valeur ajoutée en utilisant Hadoop.
« Avec une haute performance, un traitement des données en mémoire et de nombreux modèles de calcul, Apache Spark est la solution idéale pour alimenter les plateformes de traitement des données de nouvelle génération, » explique Matt Aslett, directeur de la recherche, plateformes de données et analytique, 451 Research. « L'intégration à Spark montre parfaitement, comment l’approche open source de Pentaho lui permet de répondre aux technologies émergentes qui gagnent de l’importance sur le marché des Big Data en perpétuelle évolution, et de les intégrer avec sa plateforme de gestion des données et analytique. »
Disponibilité
Pentaho Data Integration pour Apache Spark est actuellement disponible au sein de Pentaho Labs. Sa disponibilité générale est prévue en Juin 2015. Pour en savoir davantage sur les innovations de Pentaho Labs, visitez : http://www.pentaho.com/labs.