EMC et Kaggle s'associent pour offrir aux entreprises un accès « à la demande » à toute une communauté de data scientists


Rédigé par Communiqué de EMC le 25 Octobre 2012

La plate-forme d'analyse de données EMC Greenplum Chorus, avec accès libre aux quelque 55 000 data scientists de Kaggle, est désormais disponible sous licence Open Source

· La division Greenplum d'EMC Corporation et Kaggle s'attaquent au problème de pénurie de data scientists en associant la communauté des experts Kaggle à la plate-forme d'analyse de données EMC Greenplum Chorus.
· Les utilisateurs de Chorus disposent désormais d'une interface conviviale pour rechercher et consulter les profils des membres de Kaggle candidats à leurs projets. Les quelque 55 000 membres de la communauté Kaggle peuvent quant à eux postuler pour des missions de consulting publiées via la plate-forme Greenplum Chorus. L'offre combinée confèrera aux utilisateurs de Greenplum Chorus une aide précieuse pour résoudre leurs problèmes d'analyse du Big Data, tandis que les experts en science des données de Kaggle pourront mettre leurs compétences tant convoitées au profit d'un plus vaste panel d'entreprises.
· EMC annonce également la disponibilité du code source de Greenplum Chorus sous licence Open Source Apache dans le cadre du projet OpenChorus. L'objectif du projet OpenChorus est de stimuler l'innovation et d'encourager l'adoption des stratégies fondées sur la science des données afin de permettre aux entreprises de tirer le meilleur parti du Big Data.
· Chorus et l'offre combinée Chorus-Kaggle seront présentés cette semaine à la conférence O'Reilly Strata + Hadoop World de New York.



Réaffirmant sa volonté d'aider les entreprises à capitaliser sur le Big Data, EMC Corporation (NYSE: EMC) annonce, à l'occasion de la conférence O'Reilly Strata + Hadoop World de New York, la disponibilité du code Open Source d'EMC® Greenplum Chorus et un partenariat avec Kaggle, éditeur d'une plate-forme pour les concours de modèles prédictifs.

Le rapport « Big Data: The next frontier for innovation, competition, and productivity » de mai 2011 du McKinsey Global Institute fait état d'une pénurie des profils dont auraient besoin les entreprises pour exploiter le Big Data. Ce serait même le principal frein à l'adoption massive des technologies de gestion du Big Data dans l'industrie. EMC et Kaggle ont décidé de s'unir pour faire face à ce problème et d'intégrer Greenplum Chorus, la plate-forme de collaboration sociale pour experts en science des données, au réseau communautaire de Kaggle, qui fédère plus de 55 000 « data scientists ». Voilà qui devrait enfin permettre aux entreprises de contacter facilement des experts à même de relever leurs plus grands défis d'analyse de données.

La difficulté, pour la plupart des data scientists, est d'accéder aux bonnes informations et de les partager. Greenplum Chorus leur fournit justement toutes les applications analytiques de pointe dont ils ont besoin pour se constituer un écosystème complet d'exploitation des données. Cette plate-forme sociale d'analyse collaborative de données accroît la productivité des utilisateurs, réduit la charge administrative des informaticiens et délivre une meilleure visibilité sur les données, ce via un outil centralisé, pour un accès plus rapide aux informations pertinentes.

Les membres de la communauté Kaggle peuvent désormais postuler pour des missions via Chorus. De leur côté, les utilisateurs de Chorus disposent d'une interface conviviale pour rechercher et consulter les profils des inscrits sur Kaggle se portant candidats à leurs projets. L'intégration sécurisée des API Chorus et Kaggle permet aux utilisateurs de publier des informations dans les espaces de travail Chorus et de s'échanger des messages en toute sérénité. Kaggle vérifie en effet que Chorus est bien la source des messages avant de les transférer à leurs destinataires. Après avoir pris connaissance des propositions, les membres de la communauté Kaggle peuvent répondre directement aux utilisateurs de Chorus afin de négocier les conditions et d'amorcer le projet.

En misant sur la collaboration, cette offre conjointe étend les avantages du Big Data à davantage d'entreprises et offre aux meilleurs data scientists l'opportunité de mettre leurs compétences au profit du plus grand nombre.

Plus les stratégies de gestion des données des entreprises sont agiles, plus elles sont fructueuses. C'est pourquoi EMC a créé le projet OpenChorus. Son objectif est de stimuler le développement d'applications et de solutions de gestion du Big Data en donnant libre accès au code source de Chorus.

Outre Kaggle, plusieurs partenaires de la division Greenplum d'EMC ont exprimé leur soutien au projet OpenChorus et leur intention d'intégrer leurs outils et solutions à Chorus. C'est notamment le cas d'Actuate, ADVIZOR Solutions, Alpine Data Labs, Gnip, Informatica, Pentaho, Pervasive, SAS, Syncsort et Tableau Software. Consultez leurs commentaires sur le projet OpenChorus en cliquant ici.

Citations de dirigeants :

Scott Yara, vice-président senior de la division Greenplum d'EMC, en charge des produits

« La collaboration entre indépendants, entreprises et communautés est essentielle à la réussite des stratégies d'analyse du Big Data. Le projet OpenChorus s'inscrit dans une série de technologies, stratégies et outils de gestion du Big Data annoncée par Greenplum pour mettre les opportunités du Big Data à la portée d'un maximum d'entreprises, afin qu'elles puissent transformer leurs données en visions stratégiques plus payantes que jamais. Pour ce faire, il leur faut une plate-forme de collaboration à même de pallier le principal frein à l'analyse du Big Data : la pénurie de data scientists. C'est ce que nous proposons avec Kaggle, qui met désormais à leur disposition plus de 55 000 data scientists. Ce partenariat devrait définitivement changer la donne pour la science des données. »

Anthony Goldbloom, directeur général de Kaggle

« Nous avons décidé de faire équipe avec Greenplum pour offrir de nouvelles opportunités aux membres actuels et à venir de la communauté Kaggle, ainsi que pour apporter une réponse au problème de pénurie de data scientists, qui empêche les entreprises de concrétiser les promesses du Big Data. »

Disponibilité

Le code source de Greenplum Chorus est d'ores et déjà disponible dans le cadre du projet OpenChorus. L'offre combinée Chorus-Kaggle devrait être disponible en novembre 2012. Vous pouvez dès à présent télécharger Chorus pour rechercher et visualiser vos données, effectuer des analyses et modélisations, partager vos points de vue, collaborer, trouver des contributeurs pour vos projets et contribuer à votre tour aux projets de la communauté. Pour vous inscrire à la communauté Kaggle, rendez-vous sur www.kaggle.com



Dans la même rubrique :