L’outil d’alimentation est un élément essentiel d’une architecture décisionnelle. Peu valorisé, pas forcément très visuel, l’outil d’intégration de données est la porte d’entrée du système décisionnel; le « sas » devrait-on d’ailleurs plutôt dire; car il a une vocation de contrôle et d’admission des données propres dans l’entrepôt de données (voir ce terme). On en parle parfois de manière un peu négative comme de la tuyauterie du système; mais une tuyauterie indispensable sans laquelle aucun tableau de bord ne pourrait être publié.
L’acronyme anglais parle d’ETL pour Extraction - Transformation - Loading; soit Extraction - Transformation - Chargement; qui sont les trois étapes qu’il prend en charge.
L’extraction consiste à aller chercher dans les sources de données les informations nécessaires, à transférer dans l’entrepôt de données.
La transformation consiste à vérifier les données, les harmoniser, afin qu’elles puissent ensuite être comparées dans l’entrepôt de données.
Le chargement est la dernière phase, de stockage des données extraites et transformées, dans l’entrepôt de données de destination.
Avec le temps, et l’évolution des offres, l’outil d’alimentation à connu plusieurs changements :
- Certains ont proposé de faire de l’ELT; dans ce cas, la phase de transformation n’est plus faite par l’outil d’alimentation, mais dans la base de données de destination.
- Alimentation, Intégration, Hub… la terminologie a évolué, le plus souvent pour créer une différentiation marketing entre les éditeurs; mais la fonction reste la même.
Porte d’entrée du système décisionnel, l’outil d’intégration / alimentation a également un rôle clef à jouer dans :
- l’alimentation de la base des données de référence (Master Data Management - MDM) (voir ce terme)
- la création des métadonnées (voir ce terme)
- le respect des règles de sécurité, et de gouvernance des données