Avec Teradata, les entrepôts de données s'ouvrent à DevOps


Rédigé par Communiqué de Teradata le 29 Septembre 2015

Teradata Module for Python, proposé en open source, invite les développeurs à créer une nouvelle génération d'applications pour exploiter les entrepôts de données.



Pour renforcer l'agilité des traitements analytiques de données, Teradata (NYSE: TDC), le spécialiste du traitement analytique du Big Data et des applications marketing, annonce être le premier éditeur à associer les bonnes pratiques de la démarche Devops aux entrepôts de données et à leurs multiples applications, grâce à Teradata Module for Python, proposé en open-source. Ce composant permet aux développeurs logiciels de créer, dans le respect des principes de DevOps, une nouvelle vague d'applications visant à tirer le meilleur parti des données de l'entrepôt Teradata.

Teradata Module for Python permet aux développeurs et data scientists d'utiliser Python, un langage désormais universel, pour créer des applications et fonctions qui exploitent de manière simple les données de Teradata Database. Les applications Python peuvent fonctionner sur un serveur applicatif et envoyer des requêtes SQL sur Teradata Database ou être exécutées au sein de Teradata Database même. Comme pour toute application codée en Python, les développeurs disposent des multiples possibilités offertes par les bibliothèques Python à des fins de traitement analytique avancé ou de manipulation des données. Accessibles au public, les bibliothèques Python incluent la bibliothèque Python Standard, NumPy/SciPy, Biopython, Pandas, Mlpy et Dateutil/Pytz.

Les organisations gèrent des centaines ou des milliers d'applications exécutant des milliers, si ce n'est des millions de requêtes chaque jour, afin de répondre aux besoins des utilisateurs métiers. Ces applications, loin d'être statiques, évoluent constamment pour répondre à la versatilité des besoins métiers. Avec DevOps, Teradata fait le lien entre les développeurs logiciels et l'exploitation des entrepôts de données, pour ainsi concevoir, mettre à jour et gérer les applications facilement.

« En intégrant les pratiques de DevOps au sein de l'écosystème des entrepôts de données, Teradata se positionne aux avant-postes pour aider ses clients à s'offrir de nouveaux avantages concurrentiels, grâce à une infrastructure agile capable de concrétiser des opérations métiers fondées sur les données », explique Jean-Marc Bonnet, Architecte Business Intelligence au sein de Teradata International. « Le composant open source Teradata Module for Python simplifie la conception d'applications orientées DevOps, dotée de fonctions de versioning, de gestion des configurations et de journalisation des activités. »

Teradata a conçu Teradata Module for Python en capitalisant sur les pratiques DevOps identifiées dans son propre cycle de développement produit ou à partir des utilisateurs d'entrepôts de données les plus performants au monde. Lorsqu'elles conçoivent des applications avec Teradata Module for Python, les organisations n'ont pas à recréer des normes ou outils de codage pour assurer la mise en logs des paramètres opérationnels dans l'optique d'assurer un monitoring automatisé.

Teradata Module for Python offre:
Des outils et une mise en log pertinentes des applications - Teradata Module for Python est une alternative à un codage fastidieux à la main et basé sur des standards rigides de programmation. D'autre part, la solution enregistre les activités sous forme de logs et est capable d'assurer des analyses d'impact.
Une connexion simple vers Teradata Database - Les applications Python se connectent simplement à Teradata Database via des services REST (Representational State Transfer) à partir de tout équipement et à la demande, ou via des pilotes ODBC (Open Database Connectivity).
L'exécution d'applications en plus de l'exécution de requêtes - Pour aider les administrateurs en charge du monitoring des opérations, les applications conçues sous Python enregistrent les versions des scripts, les identifiants d'exécution et l'heure d'exécution. Ces données servent aux requêtes, mais aussi aux analyses d'impact des versions et aux analyses des applications.
Python Database API Specification v2.0 - Déploie simplement l'interface Python standard vers les bases de données.

« L'intégration des bonnes pratiques de DevOps au sein des organisations orientées données est une nouvelle référence en matière d'agilité, ce qui, d'ailleurs, aurait dû être fait depuis longtemps, » souligne Stephen Hendrick, Analyste principal en charge des études sur le développement et les environnements applicatifs au sein du cabinet d'études ESG. « DevOps est souvent associé à un contexte purement applicatif, mais trop rarement envisagé dans le cadre des entrepôts de données mutualisés. Teradata est idéalement positionné pour aider les clients à comprendre les interdépendances entre applications et entrepôts de données. Avec cette approche, les applications vont pouvoir évoluer pour répondre à la versatilité des besoins en matière de données et de traitement analytique ».

Teradata Module for Python est disponible dès à présent et peut être installé directement à partir de PyPI. Son code open source est disponible sur GitHub tandis que la documentation est consultable sur Teradata Developer Exchange, le site communautaire autour de Teradata Database. Vous pouvez également suivre les contributions open source de Teradata sur Teradata GitHub.



Dans la même rubrique :