Decideo - Actualités sur le Big Data, Business Intelligence, Data Science

Abonnez-vous gratuitement à Decideo !


Decideo

 


Canonical lance Data Science Stack, une solution complète pour la data science


Rédigé par Communiqué de Canonical le 22 Septembre 2024

DSS permet de mettre en place des environnements data de manière efficace, avec des outils spécialement conçus pour répondre aux besoins spécifiques du machine learning, de l’intelligence artificielle (IA) et de la science des données.



Canonical, un leader de l’Open Source et éditeur d’Ubuntu, annonce la sortie de Data Science Stack (DSS), une solution innovante qui simplifie et accélère la création et la gestion des environnements de Data Science. DSS permet aux entreprises, chercheurs et développeurs de mettre en place des environnements data de manière efficace, avec des outils spécialement conçus pour répondre aux besoins spécifiques du machine learning, de l’intelligence artificielle (IA) et de la science des données.

Entièrement open source, gratuite et native pour Ubuntu, elle est également accessible sur d'autres distributions Linux, sur Windows à l'aide de Windows Subsystem Linux (WSL), et sur macOS avec Multipass. Par défaut, DSS comprend l'accès à Jupyter Notebook pour le développement de modèles, à MLflow pour le suivi des expériences et le registre des modèles, ainsi qu'à des frameworks de ML tels que Pytorch et Tensorflow. Cependant, les utilisateurs peuvent personnaliser Data Science Stack et ajouter de nouvelles bibliothèques en fonction de leur cas d'utilisation.

DSS peut être mis en place avec seulement trois commandes, ce qui permet une exploration initiale rapide sur les stations de travail d'IA. Il suffit de configurer la couche d'orchestration de conteneurs, installer le CLI DSS et initialiser le Data Science Stack afin d'accéder à l'environnement. Cela peut être fait en 10 à 30 minutes, selon le niveau d'expérience du technicien. DSS fournit également des voies de migration, les aidant à développer leurs initiatives d'IA au fur et à mesure que les projets mûrissent.

Afin d'accéder plus tôt aux améliorations de performance et aux capacités telles que la prise en charge des GPU Intel avant leur arrivée en amont, il est possible d’accéder à ITEX et IPEX, les distributions Intel de PyTorch et Tensorflow. IPEX et ITEX améliorent les performances d'optimisation en fonction du matériel, en tirant parti des extensions vectorielles avancées (AVX), des instructions de réseau neuronal vectoriel (VNNI) et des extensions matricielles avancées (AMX). En intégrant ces extensions, en plus de l'accélération GPU, DSS bénéficie d'une accélération pour les opérations courantes dans les cas d'utilisation de l'IA, réduisant le temps d'apprentissage du modèle et accélérant la phase d'expérimentation des projets ML.

Canonical assure la maintenance de la sécurité pour tous les paquets inclus dans la solution, ce qui permet de corriger les vulnérabilités en temps voulu et de protéger à la fois le logiciel et les artefacts créés. L'offre inclut également une gestion simplifiée des dépendances et des versions logicielles, réduisant ainsi les défis techniques fréquemment rencontrés par les data scientists lors du déploiement de modèles d’IA et de machine learning. Canonical a mis un accent particulier sur l’optimisation des infrastructures cloud pour le Data Science Stack. Grâce à l’intégration avec Kubernetes et le support natif d'Ubuntu, il devient plus facile de déployer et d’évoluer dans des environnements de cloud hybrides ou multi-clouds, en bénéficiant d’une infrastructure robuste et sécurisée.

« Cela élimine le fardeau de la gestion des dépendances des paquets ou de la configuration des ressources de calcul, grâce aux commandes simples que les praticiens de l'IA peuvent exécuter », déclare Chris Schnabel, responsable de l'écosystème Silicon Alliance chez Canonical. « Par défaut, DSS comprend l'accès à Jupyter Notebook pour le développement de modèles, à MLflow pour le suivi des expériences et le registre des modèles, ainsi qu'à des frameworks de ML tels que Pytorch et Tensorflow. Cependant, les utilisateurs peuvent personnaliser Data Science Stack et ajouter de nouvelles bibliothèques en fonction de leur cas d'utilisation ».




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store