Dataiku, plateforme d'Analytique et de Data Science centralisée qui accompagne les organisations dans leur transition vers l'intelligence artificielle d'entreprise, annonce la sortie de Dataiku 7. Avec cette dernière version, la plateforme offre un niveau d'intégration supérieur permettant aux professionnels de développer des projets de machine learning, et de bénéficier d'une meilleure visibilité du fonctionnement des algorithmes d'IA (« white box »). Cette nouvelle mouture se distingue par des fonctionnalités nouvelles, notamment des applications Web reposant sur Kubernetes permettant d'optimiser les capacités offertes par Dataiku 6, et un plug-in d'étiquetage des données tirant pleinement profit du machine learning.
« La collaboration est au cœur de la philosophie propre à Dataiku depuis la création de la société en 2013. Avec Dataiku 7, nous apportons de nouvelles fonctionnalités qui s'inscrivent dans la droite ligne de notre objectif de démocratisation de l'intelligence artificielle au sein de l'entreprise », explique Florian Douetteau, PDG de Dataiku. « Dataiku 7 est notre deuxième version consécutive visant à renforcer les fonctionnalités pour bénéficier d'une IA explicable, qui demeure un sujet critique pour les entreprises de tous secteurs d'activité, qui doivent être en mesure de comprendre l'impact réel des modèles IA mis en place. »
Les entreprises du monde entier déploient aujourd'hui des efforts significatifs en matière d'IA d'Entreprise de haut en bas de la pyramide, mais peinent encore à démocratiser les projets dans l'autre sens, pour assurer un plus large accès aux données exploitables. Dans cette version 7, la plateforme s'ouvre à un plus grand nombre de professionnels de l'entreprise qui peuvent, grâce à l'IA explicable, mieux utiliser les données dans leurs prises de décision quotidiennes, et dans l'élaboration de projets IA ayant un impact réel sur leurs opérations.
Des fonctionnalités et des perspectives nouvelles avec Dataiku 7 :
Support d'analyse statistique avancée : les statisticiens peuvent maintenant utiliser Dataiku pour effectuer des analyses statistiques avancées dans un format worksheet rassemblant les tests ou autres indicateurs qu'ils ont l'habitude d'utiliser et qui leur sont familières, en collaboration avec l'ensemble de l'équipe data ou d'analyse. Le travail des statisticiens de haut niveau était auparavant limité dans l'utilisation d'outils spécifiques n'offrant aucune visibilité réelle aux non spécialistes, avec pour conséquence des goulets d'étranglement dans la gouvernance et le déploiement des projets d'intelligence artificielle.
Explicabilité des modèles : les modèles de machine learning n'offrent traditionnellement aucune perspective ou explication sur la manière dont ils parviennent à un résultat. Il est alors très difficile d'expliquer objectivement les décisions prises et les actions mises en œuvre sur la base de ces modèles. La plateforme Dataiku permet d'ouvrir les “black box” et de fournir des explications, en précisant quelles caractéristiques ou fonctionnalités ont l'impact le plus important sur les résultats produits par un modèle donné. Dataiku 7 permet non seulement de fournir une explication au niveau global, mais également au niveau de l'individu / l'observation. La lisibilité et clarté des prédictions est maintenant possible.
Git pour une collaboration étroite des codeurs : Dataiku 7 offrant une intégration plus poussée de l'outil de versionning Git, les data scientists (ou autres utilisateurs Code First) peuvent désormais créer, supprimer, modifier (Push and Pull) les branches Git directement à partir de la plateforme Dataiku. Ces capacités se traduisent par des gains significatifs en termes d'efficacité, les codeurs pouvant maintenant dupliquer les projets dans un environnement Sandbox pour gérer les changements, sans impacter le projet original. L'itération du projet dupliqué étant achevée, les changements peuvent alors être réintégrés en toute transparence dans le projet original (tous les changements sont tracés avec Git).
Plus de souplesse avec Kubernetes : Dataiku 7 revoit également à la hausse les capacités qu'offrait précédemment la version Dataiku 6 en termes de clusters Kubernetes managés, en permettant aux utilisateurs d'exécuter des applications Web sur ces clusters. Avec pour avantage des capacités de travail en simultané pour un plus grand nombre d'utilisateurs, et un backend souple et rapide pour déployer des projets IA souvent gourmands en ressources.
Plug-in d'étiquetage pour Active Learning : l'étiquetage correct des données est une condition préalable incontournable pour que les modèles de machine learning puissent produire des insights précis et de qualité. L'aptitude à étiqueter rapidement des données permet souvent d'accélérer la totalité du cycle d'analyse, en allégeant une phase de collecte des données fastidieuse et chronophage. Le nouvel étiquetage, qui permet de garder l'homme dans la boucle, et un plug-in d'apprentissage actif (Active Learning) se traduisent par une suite d'applis Dataiku permettant de faciliter le processus d'étiquetage, qu'il s'agisse de données tabulaires, d'images, ou même de son.
Dataiku permet aux plus grandes entreprises (classement Global 2 000 de Forbes) de transformer des datasets volumineux en processus décisionnels, mais aussi de démocratiser les projets d'intelligence artificielle et d'insuffler une dynamique nouvelle aux initiatives de machine learning. Dataiku 7 est le vecteur d'une collaboration élargie et d'une IA explicable, offrant ainsi les nombreux avantages de la data science à un plus grand nombre de personnes, dans le cadre d'une plateforme intuitive qui accorde la primauté au travail en équipe.
« La collaboration est au cœur de la philosophie propre à Dataiku depuis la création de la société en 2013. Avec Dataiku 7, nous apportons de nouvelles fonctionnalités qui s'inscrivent dans la droite ligne de notre objectif de démocratisation de l'intelligence artificielle au sein de l'entreprise », explique Florian Douetteau, PDG de Dataiku. « Dataiku 7 est notre deuxième version consécutive visant à renforcer les fonctionnalités pour bénéficier d'une IA explicable, qui demeure un sujet critique pour les entreprises de tous secteurs d'activité, qui doivent être en mesure de comprendre l'impact réel des modèles IA mis en place. »
Les entreprises du monde entier déploient aujourd'hui des efforts significatifs en matière d'IA d'Entreprise de haut en bas de la pyramide, mais peinent encore à démocratiser les projets dans l'autre sens, pour assurer un plus large accès aux données exploitables. Dans cette version 7, la plateforme s'ouvre à un plus grand nombre de professionnels de l'entreprise qui peuvent, grâce à l'IA explicable, mieux utiliser les données dans leurs prises de décision quotidiennes, et dans l'élaboration de projets IA ayant un impact réel sur leurs opérations.
Des fonctionnalités et des perspectives nouvelles avec Dataiku 7 :
Support d'analyse statistique avancée : les statisticiens peuvent maintenant utiliser Dataiku pour effectuer des analyses statistiques avancées dans un format worksheet rassemblant les tests ou autres indicateurs qu'ils ont l'habitude d'utiliser et qui leur sont familières, en collaboration avec l'ensemble de l'équipe data ou d'analyse. Le travail des statisticiens de haut niveau était auparavant limité dans l'utilisation d'outils spécifiques n'offrant aucune visibilité réelle aux non spécialistes, avec pour conséquence des goulets d'étranglement dans la gouvernance et le déploiement des projets d'intelligence artificielle.
Explicabilité des modèles : les modèles de machine learning n'offrent traditionnellement aucune perspective ou explication sur la manière dont ils parviennent à un résultat. Il est alors très difficile d'expliquer objectivement les décisions prises et les actions mises en œuvre sur la base de ces modèles. La plateforme Dataiku permet d'ouvrir les “black box” et de fournir des explications, en précisant quelles caractéristiques ou fonctionnalités ont l'impact le plus important sur les résultats produits par un modèle donné. Dataiku 7 permet non seulement de fournir une explication au niveau global, mais également au niveau de l'individu / l'observation. La lisibilité et clarté des prédictions est maintenant possible.
Git pour une collaboration étroite des codeurs : Dataiku 7 offrant une intégration plus poussée de l'outil de versionning Git, les data scientists (ou autres utilisateurs Code First) peuvent désormais créer, supprimer, modifier (Push and Pull) les branches Git directement à partir de la plateforme Dataiku. Ces capacités se traduisent par des gains significatifs en termes d'efficacité, les codeurs pouvant maintenant dupliquer les projets dans un environnement Sandbox pour gérer les changements, sans impacter le projet original. L'itération du projet dupliqué étant achevée, les changements peuvent alors être réintégrés en toute transparence dans le projet original (tous les changements sont tracés avec Git).
Plus de souplesse avec Kubernetes : Dataiku 7 revoit également à la hausse les capacités qu'offrait précédemment la version Dataiku 6 en termes de clusters Kubernetes managés, en permettant aux utilisateurs d'exécuter des applications Web sur ces clusters. Avec pour avantage des capacités de travail en simultané pour un plus grand nombre d'utilisateurs, et un backend souple et rapide pour déployer des projets IA souvent gourmands en ressources.
Plug-in d'étiquetage pour Active Learning : l'étiquetage correct des données est une condition préalable incontournable pour que les modèles de machine learning puissent produire des insights précis et de qualité. L'aptitude à étiqueter rapidement des données permet souvent d'accélérer la totalité du cycle d'analyse, en allégeant une phase de collecte des données fastidieuse et chronophage. Le nouvel étiquetage, qui permet de garder l'homme dans la boucle, et un plug-in d'apprentissage actif (Active Learning) se traduisent par une suite d'applis Dataiku permettant de faciliter le processus d'étiquetage, qu'il s'agisse de données tabulaires, d'images, ou même de son.
Dataiku permet aux plus grandes entreprises (classement Global 2 000 de Forbes) de transformer des datasets volumineux en processus décisionnels, mais aussi de démocratiser les projets d'intelligence artificielle et d'insuffler une dynamique nouvelle aux initiatives de machine learning. Dataiku 7 est le vecteur d'une collaboration élargie et d'une IA explicable, offrant ainsi les nombreux avantages de la data science à un plus grand nombre de personnes, dans le cadre d'une plateforme intuitive qui accorde la primauté au travail en équipe.
Autres articles
-
Dataiku met l’IA générative au service de la préparation des données
-
Dataiku 12 : une IA puissante et contrôlée au service des entreprises
-
Teradata et Dataiku renforcent leur intégration pour déployer l’IA à grande échelle
-
Artefact et Dataiku démocratisent l’adoption de solutions IA pour faciliter les prises de décisions des entreprises au quotidien
-
Dataiku obtient la désignation Google Cloud Ready – AlloyDB