Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Les bases de données en colonne permettent de revenir à l’essence de l’OLAP


Rédigé par Par Constant Konan, consultant avant-vente Sybase le 25 Mars 2010

Avec la croissance constante des volumes de données et le besoin des organisations d’élargir les usages du décisionnel, les inconvénients d’une approche OLAP basée principalement sur la constitution de cubes apparaissent de plus en plus nettement. Pour l’informatique, la gestion de ces composants peut en effet se révéler une source de coûts et de complexité considérable. Le processus d’exploitation est lourd, la maintenance est une affaire d’experts et la limitation de volume intrinsèque des cubes peut conduire à leur prolifération, délicate à appréhender.



Constant Konan, consultant avant-vente Sybase
Constant Konan, consultant avant-vente Sybase
Jusqu’à présent, les performances des cubes OLAP primaient sur ces handicaps, et, bien qu’il soit possible d’organiser les données de façon multidimensionnelle dans une base de données relationnelle, cette approche par cubes (MOLAP) l’emportait très largement. Par définition, un cube OLAP stocke un périmètre synthétique de données puis précalcule et sauvegarde toutes les combinatoires associées : c’est la matérialisation des données. Toutes les réponses aux questions potentielles des utilisateurs sont alors directement disponibles dans le système et les performances sont par conséquent inégalables. En revanche, il existe d’évidentes limitations en termes d’exploration (pas d’accès aux données de détail), de fraîcheur des données (les valeurs datent du dernier chargement) et de flexibilité.

Assez tôt, les fournisseurs de cubes ont pris conscience de ces faiblesses en permettant à leurs produits de tirer profit de la puissance croissante des bases de données relationnelles. Ainsi, depuis de nombreuses années, il est possible d’interfacer un cube avec un moteur relationnel de façon à ne matérialiser que partiellement les données du cube, voire pas du tout, auquel cas le cube sert essentiellement de support de présentation et de filtre. Mais, malgré sa faisabilité, le couplage des cubes OLAP avec les bases de données relationnelles n’a jamais vraiment convaincu en raison de performances insuffisantes. Toutefois, la tendance actuelle de l’industrie et des clients à s’orienter vers des bases de données en colonnes pour un usage décisionnel opère un net rééquilibrage.
Il n’existe que deux façons de stocker des tables (à deux dimensions) sur un support informatique forcément unidimensionnel : soit ligne à ligne, soit colonne par colonne. Ces deux options possèdent chacune leur intérêt en fonction du type d’application considéré. Historiquement, la majorité des applications étant de nature transactionnelle, ce sont les bases de données en ligne qui ont été privilégiées car elles s’accordent très bien à cet usage. Mais pour les applications décisionnelles, qui nécessitent de parcourir un très grand nombre d’enregistrements, le stockage en colonne est nettement plus efficace, offrant des performances jusqu’à cinquante fois supérieures. Et la complexité croissante des applications décisionnelles ne fait qu’amplifier ce ratio.

Optimisées pour la lecture (indexation totale) et le chargement en masse des données, les bases de données en colonnes actuelles redonnent dès lors un véritable choix entre les architectures décisionnelles, MOLAP et ROLAP essentiellement, et, dans biens des situations, la combinaison cubes et bases en colonnes impose ses avantages.

Dans l’approche MOLAP, on tire bénéfice de la conception des SGBD en colonnes pour des traitements analytiques sur de forts volumes, ce qui permet de déporter tout ou partie des calculs du cube vers la base. En outre, leurs bonnes performances accroissent les possibilités de drill-through, c’est-à-dire d’accès aux données de détail depuis le cube. Ainsi, l’utilisateur bénéficie de données à jour, plus fines, ce qui lui permet des analyses, des simulations et des planifications plus précises.
L’approche ROLAP (Relational OLAP) permet quant à elle de pallier les limites de volumes caractéristiques du cube en raccordant directement celui-ci au data warehouse. Dans ce type de configuration, une base de données en colonnes permet d’héberger un volume de données quasi-illimité tout en garantissant des temps de réponse satisfaisants. Les développements les plus récents des cubes OLAP portent précisément sur l’amélioration et l’extension du mode ROLAP car cette approche permet de conserver la même ergonomie pour l’utilisateur tout en lui ouvrant un périmètre de données bien plus vaste et perpétuellement à jour.

Pour les applications qui réclament une performance maximale, ou celles dont les indicateurs sont bien connus (communications financières, rapports d’activité…), les cubes demeurent pertinents et les bases en colonnes viennent alors les renforcer en apportant une réponse à certains enjeux d’accès aux données et d’exploitation. L’utilisateur gagne en richesse (In-Database Analytics, exploration détaillée), en précision (données à jour, échantillons élargis) et en souplesse (requêtes libres, évolutivité). Quant à l’informatique, elle tire des bénéfices significatifs : outils moins coûteux, infrastructures plus légères, ressources moins nombreuses, compétences plus courantes, architecture plus lisible et évolutive… Globalement, la mise en œuvre est plus économique et les risques sont mieux maîtrisés.
En permettant ainsi de résoudre certaines contraintes liées aux cubes, les bases de données en colonnes redonnent la priorité aux exigences métier dans le choix de l’architecture décisionnelle. Leur utilisation permet de replacer les besoins utilisateur et l’exploitation des données au centre des préoccupations, et, en somme de revenir à l’essence de l’OLAP.




Commentaires

1.Posté par RICHE Didier le 25/03/2010 08:58
Chef de projet tant AMOA que MOE, j'ai connu toutes les évolutions technologiques depuis 1971, bases de données, infocentres, progiciels. Autant vous dire que votre article m'a ravi. J'y ai retrouvé des tas d'arguments auxquels j'adhère totalement et que vous avez réussi magistralement à exprimer avec clarté. Autre point commun, je suis un adepte depuis longtemps des solutions Sybase. ceci explique peut-être cela !

Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store