Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Emballer les procédures stockées et passer à la modernisation


Rédigé par Juliette Guin, Fivetran le 29 Novembre 2023

Nous vivons dans un monde qui génère et collecte des quantités apparemment infinies de données. Ce même grand volume de données, dans sa forme brute, nécessite une transformation - ou un nettoyage, une modélisation et une manipulation pour les préparer à informer. Si les procédures stockées ont permis aux analystes et aux ingénieurs de créer et de réutiliser des requêtes SQL, elles n'ont jamais été conçues pour servir de base aux besoins actuels en matière de transformation des données.



Juliette Guin, Experte en data integration, Fivetran
Juliette Guin, Experte en data integration, Fivetran
Qu'est-ce qu'une procédure stockée ?

Les procédures stockées consistent en une ou plusieurs instructions SQL utilisées de manière répétée. Ces instructions sont ensuite stockées dans votre base de données afin que vous puissiez les « appeler » ou les « exécuter » sans avoir à réécrire la logique sous-jacente à chaque fois.

Aux yeux d'un administrateur de base de données (DBA), cela est parfaitement suffisant pour accomplir des tâches telles que la restriction de l'accès aux données sensibles ou l'augmentation des performances de la base de données. Cependant, l'utilisation de procédures stockées dans vos pipelines de données analytiques présente des inconvénients, en particulier lorsque votre équipe et votre organisation s'agrandissent.

L'échec des procédures stockées

L'augmentation de la demande de données claires, concises et cohérentes a mis à rude épreuve la fonctionnalité des procédures stockées. Bien qu'elles puissent suffire à gérer le volume de données, elles n'ont jamais été conçues pour répondre aux besoins des équipes d'analyse de données modernes. En fait, s'appuyer sur les procédures stockées peut exposer les entreprises à un risque important de dette technique.

Documentation et visibilité

Les procédures stockées n'intègrent pas de fonctionnalité de documentation. Tout ajout ou modification n'est pas suivi et est appliqué immédiatement sans documentation sur ce qui a été changé et pourquoi.

En général, la majorité des connaissances sur la procédure stockée est détenue par l'auteur de la requête. Si cette personne quitte l'entreprise, ce qui se produit à un rythme record ces derniers temps, elle emporte ces connaissances avec elle. Les pipelines sont donc vulnérables aux pannes s'il n'y a pas de transfert officiel des connaissances pour mettre à jour et maintenir la logique.

Journalisation et débogage

Tout comme leur manque de documentation, les procédures stockées ne disposent pas non plus d'une fonctionnalité de journalisation native. Les procédures stockées répondent simplement avec ce qui a été écrit dans le code sous-jacent, ce qui signifie que le débogage est aussi facile ou difficile que l'auteur l'a rendu.

La complexité d'une procédure stockée augmente avec celle du débogage. Ainsi, l'auteur peut devenir une source de responsabilité majeure si des rapports critiques pour l'entreprise sont élaborés à partir de procédures stockées que seule une ou quelques personnes ont créées ou comprises.

Flexibilité et évolutivité

Les procédures stockées sont généralement privilégiées pour les éléments qui changent rarement, illustrant le mantra « nous avons toujours fait comme ça », souvent adopté par les entreprises héritant d'une infrastructure de transformation. Cependant, avec l'évolution inévitable des données et des besoins, ces procédures entravent la croissance, notamment pour les entreprises en expansion rapide nécessitant agilité dans les transformations et rapports. Plutôt que de laisser ces méthodes restreindre votre stratégie de données, de nombreuses entreprises centrées sur les données cherchent à moderniser leur approche, bien que les contraintes de ressources et de calendrier puissent poser des défis. Malgré ces enjeux légitimes, des solutions simples sont à disposition pour aborder cette problématique.

De meilleures transformations de données avec dbt™

Pour résoudre ce problème, une approche directe s'impose dès maintenant pour réduire la dette technique liée à la modernisation des pipelines de transformation. Une solution prometteuse est dbt™ de dbt Labs, qui permet aux équipes de déployer rapidement du code analytique en suivant les meilleures pratiques de génie logiciel. Avec des modèles dbt, la documentation complète et la facilité de débogage sont au rendez-vous. En intégrant cette technologie avec des plateformes professionnelles de déplacement de données, vous synchronisez efficacement vos transformations, réduisez la latence des données et accédez à une bibliothèque de modèles préconstruits entièrement documentés, ce qui renforce vos processus tout en minimisant la dépendance aux procédures stockées et la dette technologique.

Si vous avez besoin d'aide pour démarrer, des services professionnels existent pour intégrer dbt Core afin de migrer complètement des procédures stockées vers un projet dbt où vos transformations sont documentées et produites.




Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store