A - C - D - E - F - I - K - M - N - O - S - T
attribut
Dans le cadre de la modélisation dimensionnelle, un attribut est un champs qui permet de décrire une table de dimension. Dans l'illustration suivante, City, StateProvinceCode, StateProvinceName, CountryRegionCode, CountryRegionName et PostalCode sont des attributs de la table de dimension DimGeography.
Table de dimension comprenant six attributs
Plus généralement, tous les éléments d'une table de dimension sont des attributs - à l'exception de la clé primaire.
clé primaire
Une clé primaire est une colonne (ou un ensemble de colonnes) d'une table qui identifie chaque ligne de cette table de façon unique. Dans la table de dimension suivante, la clé primaire CurrencyKey permet d'identifier une devise de façon unique.
Table de dimension munie d'une clé primaire
cube
Un cube est un modèle dimensionnel stocké dans une structure multidimensionnelle (OLAP).
dimension
Une dimension est un axe qui permet d'analyser une mesure selon différentes perspectives. Le temps, le produit, le client et la localisation géographique sont des exemples de dimension. Définition connexe : table de dimension.
drill down
L'expression drill down représente la possibilité d'obtenir une vision détaillée d'une donnée.
Prenons le cas du rapport suivant qui représente des volumes de ventes (Sales Amount) répartis par gammes de produits (Product Line) et réalisés dans deux pays (France et Canada). L'utilisateur sait par exemple que les ventes de VTT ont généré 917 158, 25 euros en France.
Vue résumée d'un volume de ventes
Selon ses responsabilités dans l'organisation, l'utilisateur aura peut-être besoin d'en savoir plus sur ce volume de ventes. Le manager en charge de la gamme VTT, obtiendra une vision détaillée de cette donnée en cliquant sur l'icône associé à Mountain Bike. C'est sur cette action précise que l'utilisateur réalise une opération de drill down qui lui fournit la vue suivante :
Vue détaillée d'un volume de ventes
Cette vue fournit, pour la gamme VTT, une répartition du volume de ventes selon les différents modèles de la gamme (HL Mountain Tire, Mountain-100...). Dans cet exemple, on remarque que l'utilisateur a la possibilité d'obtenir des détails supplémentaires avec une répartition du volume de ventes selon les différents produits d'un modèle (Product Name) :
Vue détaillée d'un volume de ventes avec une vision plus fine
En cliquant sur les icônes , l'utilisateur réalise une opération de drill up.
drill up
L'expression drill up représente le passage d'une vue détaillée d'une information à une vue résumée de celle-ci. L'opération inverse se nomme drill down.
entrepôt de données
Un entrepôt de données est une base de données qui stocke des données extraites de divers systèmes opérationnels. Un entrepôt de données est un système conçu et optimisé pour les analyses de données.
ERP (Enterprise Resource Planning)
Le sigle ERP désigne un type de système opérationnel dont le but est de supporter tout ou partie des unités opérationnelles (Ressources Humaines, Finance, Production...) d'une entreprise.
ETL (Extract Transform Load)
Le sigle ETL désigne un ensemble de processus qui ont pour rôle d'extraire des données stockées dans divers systèmes opérationnels (Extract), de transformer ces données (Transform) et de les charger dans un entrepôt de données (Load).
Quelques systèmes ETL populaires :
- Genio 7
- IBM InfoSphere DataStage
- Informatica PowerCenter
- Microsoft SQL Server Integration Services (SSIS)
- Oracle Data Integrator
- SAP BusinessObjects Data Integrator
fait
Un fait désigne soit une référence vers une table de dimensions soit une mesure. Les faits sont stockés dans des tables de faits.
informatique décisionnelle
L'expression informatique décisionnelle désigne l'ensemble des technologies, outils et processus qui permet à tout individu d'une organisation d'accéder facilement à des données et de les analyser.
KPI (Key Performance Indicator)
Un KPI (indicateur clé de performance) est une métrique financière ou non-financière qui permet d'évaluer les performances d'une organisation. Le chiffre d'affaire et la satisfaction client (évaluée quantitativement par un score) sont des exemples de KPI.
mesure
Une mesure est une donnée numérique stockée dans une table de faits. Un prix, une quantité et une remise sont des exemples de mesure.
modélisation dimensionnelle
La modélisation dimensionnelle est une technique de conception qui permet de structurer les données de façon à présenter une information intuitive aux utilisateurs et à optimiser la performance des requêtes.
modèle dimensionnel
Un modèle dimensionnel est un modèle de données structuré de façon à optimiser la performance des requêtes et la facilité d'utilisation. Le schéma en étoile est une représentation classique d'un modèle dimensionnel (les deux notions sont souvent synonymes).
MDX
MDX (MultiDimensional eXpressions) est un langage utilisé pour manipuler les données d'une base OLAP. MDX est similaire au langage SQL.
normalisation
La normalisation est une technique de modélisation qui permet de supprimer ou limiter les données redondantes au sein d'une base de données.
OLAP (OnLine Analytical Process)
L'acronyme OLAP désigne un mécanisme qui permet d'analyser des données selon différents niveaux de détails (l'année/le trimestre/le mois, le pays/la région/le département...) et différentes dimensions (le temps, le client, le produit, la localisation géographique...). Expressions usuelles : base de données OLAP, plateforme OLAP, serveur OLAP, architecture OLAP.
Concrètement, OLAP permet par exemple de répondre aux questions suivantes :
- Combien mon entreprise a-t-elle vendu de produits en 2008 dans un pays donné ? Quelle est la tendance par rapport à 2007 ?
- Comment le chiffre d'affaire a-t-il évolué au cours de ces trois dernières années ?
- Quels sont les produits les plus profitables depuis ces six derniers mois ?
OLAP se décline en quatre architectures qui permettent de s'adapter à différentes problématiques de performance et de stockage de données :
- DOLAP (Dynamic OLAP).
- HOLAP (Hybrid OLAP).
- MOLAP (Multidimensional OLAP).
- ROLAP (Relational OLAP).
Quelques solutions OLAP populaires :
- IBM Cognos 8 Business Intelligence
- Microsoft SQL Server Analysis Services (SSAS)
- MicroStrategy 8
- Oracle Essbase
- SAP BusinessObjects Web Intelligence
- SAP NetWeaver
- SAS OLAP Server
Le marché des plateformes d'informatique décisionnelle selon le cabinet Gartner : Magic Quadrant for Business Intelligence Platforms
OLTP (OnLine Transaction Processing)
Le sigle OLTP désigne un mécanisme utilisé par les systèmes opérationnels qui permet le traitement de tâches en temps réel, telles que la saisie d'une nouvelle commande ou l'édition d'un profil client. Expression usuelle : base de données OLTP.
schéma en étoile
Le schéma en étoile est une façon de représenter un modèle dimensionnel au sein d'une base de données relationnelle. Un schéma en étoile se constitue d'une table de faits associée à un ensemble de tables de dimension. Ces dernières sont toujours directement reliées à la table de faits.
Schéma en étoile comprenant une table de faits et trois tables de dimension
schéma en flocon
Un schéma en flocon est une représentation normalisée (3NF) d'une unique table de dimension. Cette table, qui peut parfois contenir un grand nombre d'attributs, est scindée en plusieurs entités. Ci-dessous, la Figure 1 représente une dimension Produit sous la forme d'un schéma en étoile et la Figure 2 présente son équivalent sous la forme d'un schéma en flocon.
Figure 1 - Dimension Produit modélisée sous la forme d'un schéma en étoile
Figure 2 - Dimension Produit modélisée sous la forme d'un schéma en flocon (normalisation)
SKU (Stock Keeping Unit)
Un SKU est un code qui permet d'identifier un produit de façon unique. Ce code a pour but de faciliter l'identification d'un produit du point de vue d'un fournisseur.
SQL (Structured Query Language)
Le sigle SQL désigne un langage informatique utilisé pour communiquer avec une base de données relationnelle.
système opérationnel
Un système opérationnel est une base de données dont le rôle est de supporter les activités quotidiennes d'une entreprise.
Exemples :
- La base de données utilisée pour la comptabilité est un système opérationnel.
- La base de données utilisée pour la gestion des ventes est également un système opérationnel.
Systèmes opérationnels pour la Gestion des ventes et la Comptabilité
table de dimension
Une table de dimension est une table constituée d'une clé primaire (définie sur une seule colonne) et d'un ensemble d'attributs. La figure suivante illustre la notion de table de dimension pour une dimension Géographie.
Table de dimension Géographie
table de faits
Une table de faits est une table constituée de références (clés étrangères) vers des tables de dimension et de valeurs numériques à analyser nommées mesures. Le schéma suivant présente une table de faits nommée FactInternetSales reliée à deux dimensions, DimProduct et DimDate. La table FactInternetSales contient quatre références vers les tables de dimension DimProduct et DimDate (respectivement ProductKey, OrderDateKey, DueDateKey et ShipDateKey) et quatre mesures nommées OrderQuantity, UnitPrice, DiscountAmount et SalesAmount.
Table de faits munie de quatre références et quatre mesures
Date de publication : mardi 10 février 2009
Date de dernière mise à jour : mardi 10 février 2009
A
attribut
Dans le cadre de la modélisation dimensionnelle, un attribut est un champs qui permet de décrire une table de dimension. Dans l'illustration suivante, City, StateProvinceCode, StateProvinceName, CountryRegionCode, CountryRegionName et PostalCode sont des attributs de la table de dimension DimGeography.
Table de dimension comprenant six attributs
Plus généralement, tous les éléments d'une table de dimension sont des attributs - à l'exception de la clé primaire.
C
clé primaire
Une clé primaire est une colonne (ou un ensemble de colonnes) d'une table qui identifie chaque ligne de cette table de façon unique. Dans la table de dimension suivante, la clé primaire CurrencyKey permet d'identifier une devise de façon unique.
Table de dimension munie d'une clé primaire
cube
Un cube est un modèle dimensionnel stocké dans une structure multidimensionnelle (OLAP).
D
dimension
Une dimension est un axe qui permet d'analyser une mesure selon différentes perspectives. Le temps, le produit, le client et la localisation géographique sont des exemples de dimension. Définition connexe : table de dimension.
drill down
L'expression drill down représente la possibilité d'obtenir une vision détaillée d'une donnée.
Prenons le cas du rapport suivant qui représente des volumes de ventes (Sales Amount) répartis par gammes de produits (Product Line) et réalisés dans deux pays (France et Canada). L'utilisateur sait par exemple que les ventes de VTT ont généré 917 158, 25 euros en France.
Vue résumée d'un volume de ventes
Selon ses responsabilités dans l'organisation, l'utilisateur aura peut-être besoin d'en savoir plus sur ce volume de ventes. Le manager en charge de la gamme VTT, obtiendra une vision détaillée de cette donnée en cliquant sur l'icône associé à Mountain Bike. C'est sur cette action précise que l'utilisateur réalise une opération de drill down qui lui fournit la vue suivante :
Vue détaillée d'un volume de ventes
Cette vue fournit, pour la gamme VTT, une répartition du volume de ventes selon les différents modèles de la gamme (HL Mountain Tire, Mountain-100...). Dans cet exemple, on remarque que l'utilisateur a la possibilité d'obtenir des détails supplémentaires avec une répartition du volume de ventes selon les différents produits d'un modèle (Product Name) :
Vue détaillée d'un volume de ventes avec une vision plus fine
En cliquant sur les icônes , l'utilisateur réalise une opération de drill up.
drill up
L'expression drill up représente le passage d'une vue détaillée d'une information à une vue résumée de celle-ci. L'opération inverse se nomme drill down.
E
entrepôt de données
Un entrepôt de données est une base de données qui stocke des données extraites de divers systèmes opérationnels. Un entrepôt de données est un système conçu et optimisé pour les analyses de données.
ERP (Enterprise Resource Planning)
Le sigle ERP désigne un type de système opérationnel dont le but est de supporter tout ou partie des unités opérationnelles (Ressources Humaines, Finance, Production...) d'une entreprise.
ETL (Extract Transform Load)
Le sigle ETL désigne un ensemble de processus qui ont pour rôle d'extraire des données stockées dans divers systèmes opérationnels (Extract), de transformer ces données (Transform) et de les charger dans un entrepôt de données (Load).
Quelques systèmes ETL populaires :
- Genio 7
- IBM InfoSphere DataStage
- Informatica PowerCenter
- Microsoft SQL Server Integration Services (SSIS)
- Oracle Data Integrator
- SAP BusinessObjects Data Integrator
F
fait
Un fait désigne soit une référence vers une table de dimensions soit une mesure. Les faits sont stockés dans des tables de faits.
I
informatique décisionnelle
L'expression informatique décisionnelle désigne l'ensemble des technologies, outils et processus qui permet à tout individu d'une organisation d'accéder facilement à des données et de les analyser.
K
KPI (Key Performance Indicator)
Un KPI (indicateur clé de performance) est une métrique financière ou non-financière qui permet d'évaluer les performances d'une organisation. Le chiffre d'affaire et la satisfaction client (évaluée quantitativement par un score) sont des exemples de KPI.
M
mesure
Une mesure est une donnée numérique stockée dans une table de faits. Un prix, une quantité et une remise sont des exemples de mesure.
modélisation dimensionnelle
La modélisation dimensionnelle est une technique de conception qui permet de structurer les données de façon à présenter une information intuitive aux utilisateurs et à optimiser la performance des requêtes.
modèle dimensionnel
Un modèle dimensionnel est un modèle de données structuré de façon à optimiser la performance des requêtes et la facilité d'utilisation. Le schéma en étoile est une représentation classique d'un modèle dimensionnel (les deux notions sont souvent synonymes).
MDX
MDX (MultiDimensional eXpressions) est un langage utilisé pour manipuler les données d'une base OLAP. MDX est similaire au langage SQL.
N
normalisation
La normalisation est une technique de modélisation qui permet de supprimer ou limiter les données redondantes au sein d'une base de données.
O
OLAP (OnLine Analytical Process)
L'acronyme OLAP désigne un mécanisme qui permet d'analyser des données selon différents niveaux de détails (l'année/le trimestre/le mois, le pays/la région/le département...) et différentes dimensions (le temps, le client, le produit, la localisation géographique...). Expressions usuelles : base de données OLAP, plateforme OLAP, serveur OLAP, architecture OLAP.
Concrètement, OLAP permet par exemple de répondre aux questions suivantes :
- Combien mon entreprise a-t-elle vendu de produits en 2008 dans un pays donné ? Quelle est la tendance par rapport à 2007 ?
- Comment le chiffre d'affaire a-t-il évolué au cours de ces trois dernières années ?
- Quels sont les produits les plus profitables depuis ces six derniers mois ?
OLAP se décline en quatre architectures qui permettent de s'adapter à différentes problématiques de performance et de stockage de données :
- DOLAP (Dynamic OLAP).
- HOLAP (Hybrid OLAP).
- MOLAP (Multidimensional OLAP).
- ROLAP (Relational OLAP).
Quelques solutions OLAP populaires :
- IBM Cognos 8 Business Intelligence
- Microsoft SQL Server Analysis Services (SSAS)
- MicroStrategy 8
- Oracle Essbase
- SAP BusinessObjects Web Intelligence
- SAP NetWeaver
- SAS OLAP Server
Le marché des plateformes d'informatique décisionnelle selon le cabinet Gartner : Magic Quadrant for Business Intelligence Platforms
OLTP (OnLine Transaction Processing)
Le sigle OLTP désigne un mécanisme utilisé par les systèmes opérationnels qui permet le traitement de tâches en temps réel, telles que la saisie d'une nouvelle commande ou l'édition d'un profil client. Expression usuelle : base de données OLTP.
S
schéma en étoile
Le schéma en étoile est une façon de représenter un modèle dimensionnel au sein d'une base de données relationnelle. Un schéma en étoile se constitue d'une table de faits associée à un ensemble de tables de dimension. Ces dernières sont toujours directement reliées à la table de faits.
Schéma en étoile comprenant une table de faits et trois tables de dimension
schéma en flocon
Un schéma en flocon est une représentation normalisée (3NF) d'une unique table de dimension. Cette table, qui peut parfois contenir un grand nombre d'attributs, est scindée en plusieurs entités. Ci-dessous, la Figure 1 représente une dimension Produit sous la forme d'un schéma en étoile et la Figure 2 présente son équivalent sous la forme d'un schéma en flocon.
Figure 1 - Dimension Produit modélisée sous la forme d'un schéma en étoile
Figure 2 - Dimension Produit modélisée sous la forme d'un schéma en flocon (normalisation)
SKU (Stock Keeping Unit)
Un SKU est un code qui permet d'identifier un produit de façon unique. Ce code a pour but de faciliter l'identification d'un produit du point de vue d'un fournisseur.
SQL (Structured Query Language)
Le sigle SQL désigne un langage informatique utilisé pour communiquer avec une base de données relationnelle.
système opérationnel
Un système opérationnel est une base de données dont le rôle est de supporter les activités quotidiennes d'une entreprise.
Exemples :
- La base de données utilisée pour la comptabilité est un système opérationnel.
- La base de données utilisée pour la gestion des ventes est également un système opérationnel.
Systèmes opérationnels pour la Gestion des ventes et la Comptabilité
T
table de dimension
Une table de dimension est une table constituée d'une clé primaire (définie sur une seule colonne) et d'un ensemble d'attributs. La figure suivante illustre la notion de table de dimension pour une dimension Géographie.
Table de dimension Géographie
table de faits
Une table de faits est une table constituée de références (clés étrangères) vers des tables de dimension et de valeurs numériques à analyser nommées mesures. Le schéma suivant présente une table de faits nommée FactInternetSales reliée à deux dimensions, DimProduct et DimDate. La table FactInternetSales contient quatre références vers les tables de dimension DimProduct et DimDate (respectivement ProductKey, OrderDateKey, DueDateKey et ShipDateKey) et quatre mesures nommées OrderQuantity, UnitPrice, DiscountAmount et SalesAmount.
Table de faits munie de quatre références et quatre mesures
Date de publication : mardi 10 février 2009
Date de dernière mise à jour : mardi 10 février 2009
Rédigé par Claude-Olivier Fontaine le Mardi 10 Février 2009 à 06:07
> A LIRE EN CE MOMENT SUR DECIDEO
-
ManoMano renforce sa gouvernance de données grâce à CastorDoc
-
Cap sur l'aviation du futur / data-driven : TCS signe un accord pluriannuel pour migrer les données d'Air France-KLM vers le cloud
-
IBM choisi comme partenaire officiel de la Scuderia Ferrari HP pour l'engagement des fans et l'analyse des données
-
Libérer l'IA sans compromis sur la sécurité : le pari des données synthétiques
-
Petit Bateau s’appuie sur Epsilon France pour moderniser son écosystème data et accompagner sa transformation digitale
-
Les défis économiques et écologiques de la révolution de l’intelligence artificielle
-
Le streaming de données ou la boite à outils pour créer les futurs services financiers
-
Données peu centralisées : un frein aux capacités d’analyse des entreprises françaises, selon Alteryx
-
Starburst annonce une capacité d’ingestion de données en streaming de 100 Gb/seconde depuis Apache Kafka vers les tables Apache Iceberg
-
Partout en Europe, des entreprises adoptent Oracle EU Sovereign Cloud pour gérer leurs données stratégiques
À propos
Claude-Olivier Fontaine est un consultant en systèmes d'information décisionnels spécialisé dans la mise en œuvre de solutions de reporting et l'accompagnement en gestion de projets.
Archives
Dernières notes
Certifié en gestion de projets avec Prince2
07/12/2011
Certifié sur la plateforme ETL Talend
12/04/2011
Mes publications
02/04/2011
Le marché des plateformes décisionnelles
07/02/2010
Mon Agenda pour les TechDays 2010
13/01/2010