Canonical lance Data Science Stack, une solution complète pour la data science

Canonical, un leader de l’Open Source et éditeur d’Ubuntu, annonce la sortie de Data Science Stack (DSS), une solution innovante qui simplifie et accélère la création et la gestion des environnements de Data Science. DSS permet aux entreprises, chercheurs et développeurs de mettre en place des environnements data de manière efficace, avec des outils spécialement conçus pour répondre aux besoins spécifiques du machine learning, de l’intelligence artificielle (IA) et de la science des données.

Entièrement open source, gratuite et native pour Ubuntu, elle est également accessible sur d'autres distributions Linux, sur Windows à l'aide de Windows Subsystem Linux (WSL), et sur macOS avec Multipass. Par défaut, DSS comprend l'accès à Jupyter Notebook pour le développement de modèles, à MLflow pour le suivi des expériences et le registre des modèles, ainsi qu'à des frameworks de ML tels que Pytorch et Tensorflow. Cependant, les utilisateurs peuvent personnaliser Data Science Stack et ajouter de nouvelles bibliothèques en fonction de leur cas d'utilisation.

DSS peut être mis en place avec seulement trois commandes, ce qui permet une exploration initiale rapide sur les stations de travail d'IA. Il suffit de configurer la couche d'orchestration de conteneurs, installer le CLI DSS et initialiser le Data Science Stack afin d'accéder à l'environnement. Cela peut être fait en 10 à 30 minutes, selon le niveau d'expérience du technicien. DSS fournit également des voies de migration, les aidant à développer leurs initiatives d'IA au fur et à mesure que les projets mûrissent.

Afin d'accéder plus tôt aux améliorations de performance et aux capacités telles que la prise en charge des GPU Intel avant leur arrivée en amont, il est possible d’accéder à ITEX et IPEX, les distributions Intel de PyTorch et Tensorflow. IPEX et ITEX améliorent les performances d'optimisation en fonction du matériel, en tirant parti des extensions vectorielles avancées (AVX), des instructions de réseau neuronal vectoriel (VNNI) et des extensions matricielles avancées (AMX). En intégrant ces extensions, en plus de l'accélération GPU, DSS bénéficie d'une accélération pour les opérations courantes dans les cas d'utilisation de l'IA, réduisant le temps d'apprentissage du modèle et accélérant la phase d'expérimentation des projets ML.

Canonical assure la maintenance de la sécurité pour tous les paquets inclus dans la solution, ce qui permet de corriger les vulnérabilités en temps voulu et de protéger à la fois le logiciel et les artefacts créés. L'offre inclut également une gestion simplifiée des dépendances et des versions logicielles, réduisant ainsi les défis techniques fréquemment rencontrés par les data scientists lors du déploiement de modèles d’IA et de machine learning. Canonical a mis un accent particulier sur l’optimisation des infrastructures cloud pour le Data Science Stack. Grâce à l’intégration avec Kubernetes et le support natif d'Ubuntu, il devient plus facile de déployer et d’évoluer dans des environnements de cloud hybrides ou multi-clouds, en bénéficiant d’une infrastructure robuste et sécurisée.

« Cela élimine le fardeau de la gestion des dépendances des paquets ou de la configuration des ressources de calcul, grâce aux commandes simples que les praticiens de l'IA peuvent exécuter », déclare Chris Schnabel, responsable de l'écosystème Silicon Alliance chez Canonical. « Par défaut, DSS comprend l'accès à Jupyter Notebook pour le développement de modèles, à MLflow pour le suivi des expériences et le registre des modèles, ainsi qu'à des frameworks de ML tels que Pytorch et Tensorflow. Cependant, les utilisateurs peuvent personnaliser Data Science Stack et ajouter de nouvelles bibliothèques en fonction de leur cas d'utilisation ».

Autres articles

Canonical lance Data Science Stack, une solution complète pour la data science

DSS permet de mettre en place des environnements data de manière efficace, avec des outils spécialement conçus pour répondre aux besoins spécifiques du machine learning, de l’intelligence artificielle (IA) et de la science des données.

Canonical lance Charmed OpenSearch pour une gestion optimisée des données

La recette à suivre pour un projet d’IA réussi

Canonical lance Charmed Spark, une solution compatible avec Apache Spark® sur Kubernetes

Canonical lance la plateforme Charmed Kubeflow MLOps sur AWS

Canonical annonce la dernière version de Charmed Kubeflow 1.7, sa plateforme MLOps open-source

Qlik s’associe à TD SYNNEX pour promouvoir l’IA au sein des entreprises d’Europe et d’Amérique du Nord - 27/01/2025

AAA DATA & Sales Intelligence by Altares lancent 4AForReach : une solution display inédite pour booster la performance des entreprises dans le secteur de l’automobile grâce à la data - 22/01/2025

Accor rejoint l’alliance technologique inédite scellée par Pernod Ricard et JCDecaux dans la gestion de données - 22/01/2025

Samsara dévoile Samsara Intelligence, son IA conçue pour réinventer les opérations physiques et résoudre les problèmes complexes rencontrés sur le terrain - 22/01/2025

Qlik acquiert Upsolver pour proposer l’ingestion et l’optimisation à faible latence pour Apache Iceberg - 21/01/2025