Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Sybase IQ lance un pavé dans les bases décisionnelles


Rédigé par Barbara Poirette le 31 Janvier 2005

Sybase pourrait reprendre à son compte l’accroche publicitaire d’un célèbre nettoyant ménager : mini prix, mais il fait le maximum ! L’éditeur jette un pavé dans la mare et crée la rupture technologique. Selon les premiers retours des entreprises utilisatrices, il était temps ! Mais une chose est sûre, Sybase IQ bouscule des positions établies !



Andréguy Dubar - Directeur Général Cenisis
Andréguy Dubar - Directeur Général Cenisis
Sybase marque la rupture. Avec Sybase IQ, l’éditeur place sur le marché une offre hautement concurrentielle, avec un ratio performance, prix, délais de mise en œuvre très attractif comparativement aux bases de données traditionnelles. Revers de la médaille, le principal problème de l’éditeur repose justement sur les performances obtenues par Sybase IQ…

Difficile en effet pour une entreprise habituée à la mise en place de machines toujours plus imposantes, à des budgets et une maintenance conséquents, à la réalisation d’agrégats et de règles de cadrage des requêtes destinés à obtenir des temps de réponse satisfaisants… de ne pas trouver suspecte une solution énoncée comme plus performante et plus facile à mettre en œuvre, moins contraignante en terme d’administration et d’infrastructure et moins onéreuse, au niveau de la base elle-même comme de l’enveloppe du projet. Bruits et rumeurs, la différence de budget entre la mise en place d’une base traditionnelle et de Sybase IQ, dans un contexte décisionnel, s’inscrirait dans un ratio allant jusqu’à un pour dix.

Un grand pas pour le décisionnel

L’éditeur entraîne plusieurs niveaux de rupture, technologique et nous y reviendrons, mais Sybase rompt également le principe convenu que le budget doit être proportionnel à l’augmentation des performances, du stockage, etc. La surenchère financière n’est donc plus un passage obligé : il est possible de parvenir à de meilleurs résultats et avec des moyens économiques. Inutile d’être grand clerc pour en déduire que Sybase IQ engendrera autant de satisfactions que de crispations sur le marché.

La fin d’un paradoxe

Le décisionnel répond à des particularités auxquelles les SGBD transactionnels ne pouvaient répondre naturellement. « La principale caractéristique du décisionnel est que l’on ne sait jamais par avance les chemins d’analyse pris par les utilisateurs. Et c’est bien là tout le paradoxe auquel ont aboutis les projets. Dans la grande majorité des cas, les entreprises ont mis en place des consignes, désignant les requêtes autorisées et les limites à ne pas franchir, afin de préserver les temps de réponse. Le résultat est contradictoire : si un utilisateur soumet une requête c’est que celle-ci répond à un enjeu métier et, à ce titre il peut être néfaste pour l’entreprise de brider l’usage décisionnel », développe Andréguy Dubar, directeur général de Cenisis, intégrateur Sybase notamment.

Concernant Sybase IQ, notre interlocuteur est sans équivoque. Les bases transactionnelles telles que Oracle, Microsoft SQL Serveur et autres ne sont absolument pas adaptées à une utilisation décisionnelle. « Ce n’est pas leur vocation et nous sommes capables d’expliquer pourquoi. De la même manière nous sommes capables d’expliquer comment Sybase, avec IQ, a résolu ce problème ». Andréguy Dubar poursuit d’ailleurs le raisonnement : si IQ est parfaitement adapté au domaine décisionnel, face à des transactions de saisie de commandes, de facturation et plus généralement face à tout acte de gestion au sens ERP par exemple, Sybase IQ n’est technologiquement pas la base qui convient.

Cheminement décisionnel

« Il faut bien se représenter la démarche d’un utilisateur décisionnel. Il débute par des questions simples : chiffre d’affaires par famille de produit et par année. Ce seul niveau d’interrogation a des conséquences catastrophiques sur une base transactionnelle. Les années et les produits sont récupérés respectivement dans les tables « temps » et « libellé de famille ». En revanche, le chiffre d’affaires se trouve dans la table de faits qui contient soit des lignes de facture, soit des lignes de tickets de caisse pour la distribution… rapidement cela peut impliquer deux cents millions à un milliard de lignes. Chercher le chiffre d’affaires sur toutes les années revient à lire chaque ligne de la table de faits et à charger la totalité des octets de chaque ligne. C'est-à-dire que pour une à deux colonnes nécessaires (chiffre d’affaires ou quantité/prix) vous chargez en mémoire un ensemble de colonnes absolument inutiles dont le code article, la remise, etc. Une base transactionnelle crée une table temporaire dans laquelle sont stockés les octets utiles (quantité et prix, par exemple) et c’est à partir de là que débutent les calculs. En conclusion, pour 98 % du temps vous aurez fait travailler inutilement la machine. Cette pollution rend les bases traditionnelles inaptes à servir le décisionnel. En l’occurrence Sybase IQ ne stocke pas des lignes mais des colonnes. Dans le même cas de figure, seules les colonnes quantité et montant sont chargées et la multiplication se fait en mémoire. Ce seul point explique en grande partie les décalages de performance » détaille Andréguy Dubar.

Temps de réponse, témoignage à charge !

Il arrive que les temps de réponse débordent du cadre supportable par les utilisateurs ou présentent des délais pour le moins aléatoires : de quelques minutes à plusieurs heures. Pour notre interlocuteur il s’agit d’un phénomène symptomatique. Les temps de réponse sont conditionnés tant par la complexité des requêtes que par le nombre d’accès simultanés. Toutes les bases de données peuvent obtenir une requête de référence à une dizaine de minutes. « Le problème se trouve dans le carcan et les procédures qui doivent être mis en place pour parvenir à ce résultat. Les requêtes sont bridées - optimisées - et toute tentative dépassant ce cadre ramène inexorablement les délais à plusieurs heures. Et cela ne vaut que pour une requête, dès que la base endure des accès simultanés, les temps de réponse explosent de manière exponentielle. Les délais obtenus avec Sybase démontrent par l’exemple que la solution ne joue pas dans la même catégorie. Et ce n’est pas un procès à charge pour les bases transactionnelles. Dans le cadre d’un projet, les résultats obtenus avec plusieurs bases transactionnelles se situaient dans une fourchette de huit à dix minutes pour la requête de référence, avec une forte optimisation. La montée en charge des utilisateurs, comme l’intervention de requêtes aléatoires a fait s’effondrer les résultats. Le même test conduit avec Sybase IQ a dépassé nos estimations les plus optimistes. J’avais évalué la requête la plus simple à trois minutes et la plus complexe à dix minutes… Toutes les données ont été chargées et l’ensemble des agrégats supprimés. Nous avons lancé la requête la plus complexe et le résultat est tombé une minute plus tard. Nous nous sommes sentis obligés de relancer la requête, persuadés que nous avions oublié quelque chose. A ce moment précis, vous savez que vous avez changé de dimension ! » précise-t-il.

La simulation croissante du nombre d’utilisateurs ne laisse pas plus de place au doute, d’autant que notre interlocuteur précise que ce test initial n’a fait l’objet d’aucune recherche d’optimisation particulière. Des requêtes sont donc lancées de manière aléatoire par un programme batch. Une activité continue est simulée jusqu’à atteindre neuf utilisateurs simultanés. Vient en suite la dixième requête. La requête étalon lancée sur Sybase IQ livre son résultat en neuf minutes. « A titre de comparaison et considérant les délais exponentiels auxquels sont soumises les bases transactionnelles, il n’est pas rare d’attendre une trentaine de minutes avant d’obtenir un résultat et ce en se limitant à trois requêtes simultanées. Par ailleurs, la qualité des temps de réponse réduit d’autant la probabilité de requêtes simultanées. Pour une trentaine d’utilisateurs et avec les temps de réponse de une minute à dix heures, la probabilité de requêtes simultanée est forte. En revanche, dans le cas où les temps de réponse sont inférieurs ou égaux à une minute cette probabilité est nettement plus faible, avec trois requêtes simultanées au grand maximum », développe Andréguy Dubar.

Analyse débridée

Au delà des temps de réponse, notre interlocuteur soulève l’importance d’une liberté d’analyse retrouvée, avançant que l’une des constantes du décisionnel est le changement. Brider l’acte d’analyse revient à demander à un archéologue de découvrir des sites oubliés sur un circuit touristique. « La pensée humaine procède par itération. Tant que vous n’avez pas ouvert la porte, vous ne savez pas qu’il y en a dix autres derrière, et ainsi de suite. Dès qu’un utilisateur, quel que soit son niveau, découvre quelque chose, sa curiosité le pousse à poursuivre… A ce titre, une plate-forme décisionnelle doit facilement pouvoir accepter les requêtes aléatoires, mais aussi de nouvelles données, de nouvelles colonnes. Dans un contexte traditionnel, ces tâches sont régulièrement remises à plus tard ou pire, elles attendent une montée de version. A titre d’exemple, une base d’un milliard de lignes place l’intervention entre 2 et 24 heures. Ici encore, l’ajout d’une colonne sur Sybase IQ est instantané ».
Le stockage figure également aux qualités de Sybase IQ. Toujours a titre d’exemple Andréguy Dubar cite une base de 140 Go qui transférée dans IQ n’atteignait plus de 28 Go.

Avis concordants

« Nous passons pour des illuminés, qu’il s’agisse des temps de réponse avancé, de l’optimisation en terme de stockage ou de la linéarité des temps de réponse en fonction de la charge. C’est rassurant pour une entreprise de savoir où elle va : les temps de réponse sont prédictibles, donc si elle doit doubler le nombre de ses utilisateurs, il lui suffit de doubler la machine. Le terme de rupture technologique n’est pas innocent, Sybase fait la différence ! ». Et il semblerait que les avis concordent.

Finalement les principaux défauts de Sybase IQ relevés par ses concurrents restent limités : certains évoquent la faible représentativité de son éditeur, là où d’autres parlent d’un risque lié à la pérennité… Sybase bouscule l’ordre établi ! Signe avant coureur d’un retour sur le devant de la scène informatique pour l’éditeur… décideurs, à vous de voir.




Commentaires

1.Posté par pascal varenio le 13/11/2005 14:02
Il faut tout de même se rappeler que Sql Serveur n'est que le petit fils de Sybase et malheureusement, on s'aperçoit que les coûts de SQL 2005 prennent l'ascenceur.Je trouve la démonstration très pertinente quant à la prévision des interrogations; qui font soit écrouler un système OLTP; soit nécessitent une modélisation (star, snow) prédéfinie et donc longue a modifier.

2.Posté par JL Sthene le 11/02/2006 14:57
Cet article revient à dire qu'une base multidimensionnelle est mieux adaptée à l'analyse qu'une base transactionnelle.Et qu'un nouvel outil vient de sortir en intégrant des caractéristiques techniques adaptés à ses objectifs.Effectivement, pour ratisser il vaut mieux employer un rateau qu'une pelle ...Vous en avez d'autres des comme ça ?Salutations.

3.Posté par oberlechner stephane le 08/03/2006 16:01
"Nous avons lancé la requête la plus complexe et le résultat est tombé une minute plus tard" : Est-ce un argument valable quand on se présente comme un acteur du décisionnel ? Sans le nommer, vous évoquez le concept OLAP déjà présent et mature chez plusieurs éditeurs, mais également présent dans la communauté open Source

4.Posté par Andreguy DUBAR le 28/03/2006 14:30
Sybase IQ est une base RELATIONNELLE dédiée au décisionnel. Sa technologie permet des temps de réponse à la seconde tout en stockant des centaines de millions ou des milliards de lignes (certifiée pour mille milliards de lignes...), en ayant des hautes performances en intégration (intégrant les contrôles et les calculs). Elle ne remet pas en cause les compétences et les choix mis en place (SQL, infrastructure, ...) ni les outils décisionnels en place (requêteurs ...). Sybase IQ stocke la granularité la plus faible en volume et permet des temps de réponse à la seconde en accès.Dans l’exemple de Phildar, les requêtes ne prennent que quelques secondes, sans jamais dépasser 1minutes, sur une table de 500 millions de lignes ….Sybase IQ est donc une base relationnelle qui permet d'éviter une surcouche Multidimensionnelle qui n'est vraiment intéressante dans ce cas que pour l'analyse financière. Or il me semble que l’Olap est plus souvent cité pour répondre à des enjeux de temps de réponse.Et pour le reporting ? ..... IQ ….

5.Posté par Francois M. le 15/08/2007 21:28
Beaucoup de logiciels devaient à leurs sorties revolutionner le monde et enterrer les concurrents.
Une fois le marketing et les effets d'annonces passés, il n'en n'est rien.

Les ventes sont assez marginales, ce n'est pas un standard, cela va donc tout doucement mourir selon la loi qui veut que seul le leader et microsoft subsistent.

Sybase IQ a une stratégie différente en terme de bases de données.
Certe en terme d'integration elle est plus rapide que un SGBD classique.
Certe en terme de requetage pur, cette base de données est tres rapide.

MAIS Sybase IQ a beaucoup d'inconvenients qui deviendront pour une grooses majorité de clients ridibitoires à commencer par la mise à jour des données


6.Posté par francois M. le 20/08/2007 21:36
Suite à une demande, je vais approfondir mon mail précédent.

Sybase a semble t-il voulu miser sur les temps de réponse pour des requetes sur des tables volumineuses.
Les temps de réponse peuvent être en effet nettement plus rapide que les SGBD classique ( oracle et sql server)

Je ne suis pas assez caller pour expliquer l'architecture mais voila ce que j'ai compris :
Les principaux SGBD sont construit pour pouvoir inserer, mettre à jour, supprimer des données tout en optimisant la taille des fichiers, l'espace à réallouer et l'espace prévu de stockage.
Pour pouvoir accéder plus rapidement aux données, la stratégie se base sur des indexs ( ainsi que partitions, ...)

Sybase IQ privilégie que l'insertion.
Les performances de sybase IQ avec une table contenant de nombreuses mises jour se revèle déplorable ( en gros pire qu'une table d'un SGBD sans indexs).

Cela revient à dire que dans le cas d'un SI décisionnel, il faut reconstruire quotidienne une majorité des tables.

ce qui entaine les inconvénients suivants (Par ordre décroissant d'importance)

1er inconvénient :
Dans la plupart des datawarehouses des grandes sociétés où j'ai pu intervenir, il est impossible de reconstruire quotidiennement les plus grosses tables.

2ème Inconvénient :
Une alimentation au fil de l'eau repose sur des mises à jour. Il est donc
inenvisageable de faire de l'alimentation en temps réel ou quasi réel.

3ème inconvénient :
Au vu des 2 premiers inconvénients, il faut donc avoir un datawarehouse basé sur une autre base que Sybase IQ.
Ce qui entrainent le fait d'avoir plusieurs SGBD différents.
Donc cout supplémentaire en terme de licence.

3ème inconvénient bis :
Sybase IQ n'est pas un standard et il est toujours difficile pour un DSI d'aller vendre cette solution qui sera jugée comme exotique.

4ème inconvénient :
Cout suppléménetaire en terme de temps pour créer après le DWH la base de données Sybase IQ

5ème inconvénient :
Pour un DSI, il y a peu d'expert sur sybase IQ donc cout supplémentaire en terme de formation et de prestation.

Personnellement le choix de Sybase IQ se limite d'après moi que pour des datamarts, des bases répliquées de consultations ( base de fabrication basée sur un SGBD classique et une base répliquée servant à la consultation) si cette solution arrive à être vendu auprès des directions

Il serait interessant de savoir exactement et pour quel usage est fait de Sybase IQ chez leurs clients

7.Posté par François GUERIN - Responsable Avant-Vente - SYBASE France le 19/09/2007 12:17
Le point de vue de l’éditeur
Un lecteur assidu du site a attiré mon attention sur le commentaire posté par « François M. » qui justifie d’apporter quelques précisions

Sybase IQ possède une architecture interne simple destinée à favoriser l’analyse des données mais il ne nous a pas échappé qu’il fallait aussi assurer des mises à jour efficaces en amont (ou en parallèle…) à la restitution des données.

Pour ce qui est des processus de mises à jour, Sybase IQ est extrêmement efficace sur n’importe quel type de traitement de masse et en particulier sur des traitements SQL ensemblistes (y compris update ou delete).
Il est tout à fait compétitif sur ce plan face à des solutions « standards » et en particulier quand il faut mettre à jour, supprimer et insérer des milliers ou des millions de lignes.
Sybase IQ est inadapté pour des applications transactionnelles classiques, ou chaque « transaction » consiste à mettre à jour une ou quelques lignes dans une base de données.
SYBASE IQ est dédié aux projets décisionnels qui se caractérisent plutôt par des mises à jour importantes (chaque « transaction » portant sur un grand nombre de lignes) pilotées par des programmes spécifiques ou des outils type ETL.

Pour être plus précis sur le plan des techniques de développement, il est effectivement inefficace et déconseillé de réaliser avec Sybase IQ un grand nombre d’opérations répétitives « ligne à ligne » mais il est conseillé et parfaitement efficace de réaliser des opérations de mises à jour portant sur un grand nombre de ligne (un ordre UPDATE portant sur un millions de lignes est très performant, l’enchaînement d’un million d’ordre UPDATE portant chacun sur une ligne est très pénalisant)

Il faut d’ailleurs préciser que les SGBD « standards » s’accommodent aussi beaucoup mieux de logique de traitement SQL ensembliste que de logique de traitement ligne à ligne en particulier quand il faut justement traiter des flux de taille significative. Beaucoup d’utilisateurs souffrent des performances de leur SGBD « standard » en mises à jour des environnements décisionnels parce qu’ils n’ont pas prêtés attention à ces aspects.

Au-delà de l’organisation des traitements, nous pouvons aussi parler de la fréquence à laquelle ces traitements de masse sont appliqués sur une base comme Sybase IQ. Une majorité de nos clients mettent à jour leur environnement décisionnel quotidiennement. Quelques clients ont fait le choix de mettre à jour les données de leur environnement Sybase IQ en continu tout au long de la journée, ils ont pris en compte nos préconisations sur le développement des processus d’alimentation et ont mis en œuvre des projets parfaitement opérationnels.



A titre de précisions complémentaires

- Il n’est absolument pas question de reconstruire quotidiennement la moindre table.

- L’alimentation « au fil de l’eau » est une solution mise en œuvre aujourd’hui par certains de nos clients

- Sybase IQ permet de mettre en œuvre indifféremment, Data Warehouse, Data Mart, Operationnal Data Store ou toute autre approche adaptée au périmètre du projet.
Ces choix d’architecture ne doivent justement pas être guidés par des considérations techniques, quant au débat sur les mérites comparés de telle ou telle approche c’est un autre sujet.

- « Sybase IQ n’est pas un standard » et c’est justement une de ses qualités majeures, Sybase a fait le choix d’une approche différente pour apporter une solution nettement différente des approches traditionnelles. Sortir des standards est la seule solution pour échapper aux problèmes « standards » de performances en restitution comme en alimentation, de coûts d’administration, de coûts de plates-formes surdimensionnées


J’aurais grand plaisir à apporter plus d’informations sur Sybase IQ à tous ceux qui le souhaiteront



8.Posté par M.C le 20/09/2007 11:45
Bonjour,

en tant que responsable du décisionnel dans une entreprise utilisatrice francaise, je m'inscrit en faux par rapport à ce que peut écrire Monsieur François M.

J'avais une journalière qui tournait en 28 heures sur un autre SGBD... Et sur IQ, elle tourne désormais en 1h30...

Quand aux contraintes techniques que vous présentez, vous partez sur un postulat qui, je permets de vous le dire, est faux : "Sybase IQ privilégie que l'insertion." Du coup, vos conséquences qui en déclinent sont fausses...

Nous ne reconstruirons pas nos tables qui font plusieurs dizaines (voie centaines pour certaines) de lignes... D'ailleurs, je ne comprends pas ce que cela veut dire, alors que nous utilisons cette base !

L'alimentation au fil de l'eau ne pose pas de problème dans une société bien organisée. Certes, les tables sont lockées lors de l'alimentation. Mais un décisionnel bien conçu ne permet pas l'alimentation au fil de l'eau en parrallèle par des processus concurrents (ou alors, donnez un exemple business, car si c'est le cas, je doute que ce soit du décisionnel)

3eme et 4eme inconvénients.
Nous avons choisi de déployer Sybase IQ en // de notre DWH existant. Nous n'avons même pas "formé" les DBA tant l'utilisation est simple ! le surcout en administration spécifique est quasi nul, et est sans commune mesure avec la valeur ajoutée pour nos utilisateurs, qui n'attendent que qq secondes contre plusieurs dizaines de minutes pour avoir leur résultat...

5eme inconvénient. Il n'y a pas besoin d'expertise sur Sybase IQ. C'est du standard, et pas besoin de mettre en place des partitions, des vues matérialisées, du tuning pontu... C'est "naturellement" performant...


Signé : un client très satisfait qui envisage la généralisation de Sybase IQ. (Notre base actuelle fait plus de 3To). Et aujourd'hui, si je pouvais repartir de Zéro, je ne ferais probablement pas d'étude, je partirais directement sur cette solution.

9.Posté par Stefan le 20/09/2007 21:33
Entièrement d'accord avec M.C.

La techno IQ est plutôt une "concurrente" des technos OLAP. Leur positionnement ne remet aucunement en cause un DW car ces technos sont plutôt orientés DataMart. Les DataMarts sont faits pour être alimentés et exploités. Des INSERT et des SELECT donc, et Sybase IQ est parfaitement optimisée pour ces fins précises de nature décisionnelle.

Pour ce qui est de l'alimentation en temps réel, une techno de type EII fera largement mieux l'affaire qu'une alimentation au fil de l'eau beaucoup plus difficile à mettre en place et à maintenir. Je peux vous citer Actuate Information Objects par exemple ou les technos IBM EII Information. Ces technos sont le complément naturel des technos ETL d'alimentation en batch et fournissent en prime une couche sémantique traduisant les infos tech en language métier tout en passant les données au crible pas des règles métier pour assurer la qualité des données.

Cher françois M, je pense donc que vous mélangez un peu des choux et des carottes. Regardez mieux le positionnement de chaque outil avant de critiquer.

Sybase , ils ne sont peut être pas brillants dans le marketing, mais techniquement ils assurent :-)

10.Posté par F.D le 27/09/2007 14:18
J'abonde également dans le sens de M.C.
En revanche, je ne suis pas d'accord avec Stephan
Selon moi, IQ n'est pas un concurent d'OLAP. IQ est destiné a une utilisation de requétage massif sur de la donnée de détail, OLAP est destiné a de l'Analyse (A de OLAP), à savoir navigation multidim dans les différentes données agregée (données numerique pour la plupart).
Les temps de requétage dans les cubes sont très bons, mais un drill-through depuis un trop haut niveau d'agregation dans le cube nous rammera certes les données de détail de la table de fait entrant dans le calcul de l'agregation, mais avec un temps de réponse déplorable par rapport à une requete identique lancée sur IQ.

IMHO, IQ n'a PAS de concurrent dans son secteur.

Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store