Sur les aspects purement datavisualisation (création des représentations graphiques) et création de mesures (moteur de formules), les logiciels sont souvent équivalents entre les versions Cloud et serveur. Mais les versions Cloud sont souvent très limitées en terme d’automatisation et de traitement de données.
Pourtant, Cloud ou pas, les besoins de ce genre existent. Par exemple, on peut vouloir envoyer un email avec un rapport en pièce jointe si une mesure dépasse un seuil critique, charger un fichier de données une fois que celuici a été déposé sur un serveur, mettre à jour le cache de données d’un dashboard... Mais il peut aussi s’agir d'exécuter un script de traitement de données et stocker les résultats dans un datawarehouse. Comme exemples, on peut citer l’analyse de cohortes ou de parcours clients, le clustering de magasins, un calcul prédictif.... On s’éloigne ici de la notion de datavisualisation pure. Mais pour une majorité de projets, le fait de pouvoir exécuter ces traitements, stocker les résultats et réaliser les dashboards associés sur une même solution est un atout très fort pour l’agilité et le succès du projet. On évite ainsi les problèmes d’échanges de données (et les problèmes de sécurité associés), de multiplicité d’outils et de compétences nécessaires, d’incompatibilité des systèmes. En résumé, on diminue la complexité globale et le temps de mise en oeuvre d’un projet. Ce type de solution unifiée qui répond à cette plage de besoins rentre dans l’appellation BI/DW PaaS (pour Business Intelligence / DataWarehouse PlateformAsAService).
Aujourd’hui, les technologies pour mettre en oeuvre ce genre de plateforme de données existent. Les architectures Cloud basées sur des systèmes distribués, extensibles, virtualisés et asynchrones sont arrivées à maturité. Les Cloud providers comme AWS (Amazon Web Services), Microsoft Azure ou encore Google Cloud sont très performants. Et la technologie de containers Docker permet d’assouplir encore l’orchestration de telles plateformes, notamment sur des Cloud privés.
Pour les éditeurs classiques de BI, on pourrait croire qu’il s’agit d’un choix de positionnement produit de ne pas présenter de plateforme de données Cloud. Mais c’est difficile à croire puisque les solutions traditionnelles de type serveur sont plutôt des plateformes (avec scheduler, systèmes de tâches, des intégrations Python/R...). Ce sont les nouvelles versions Cloud qui ont abandonné cet aspect pour se focaliser sur la selfservice datavisualisation. La course entre éditeurs pour répondre au phénomène Cloud les a certainement amenés à simplifier leurs produits, ne proposant ainsi qu'une solution de datavisualisation en Cloud et nécessitant l'installation desktop/serveur pour bénéficier d’une plateforme plus complète.
Bien sûr pour certains projets, on voudra utiliser le meilleur ETL du marché, avoir des options avancées de nettoyage de données, configurer finement son datawarehouse, gérer son propre système de programmation de tâches et sa propre infrastructure de calcul. Dans ce cas, un BI/DW PaaS sera moins pertinent.
Mais pour de nombreux projets, une plateforme Cloud unifiée incluant un datawarehouse, un module de datavisualisation et un moteur d’automatisation de traitement de données sera plus agile et moins coûteuse tout en restant aussi performante. C’est ce positionnement qu’a choisi par exemple Serenytics en démarrant directement sur une architecture Cloud très moderne. Comme toujours, le choix de la solution dépend du projet et de son contexte. Mais ce type de plateforme est à considérer dans l’éventail des options de Cloud BI.
Pourtant, Cloud ou pas, les besoins de ce genre existent. Par exemple, on peut vouloir envoyer un email avec un rapport en pièce jointe si une mesure dépasse un seuil critique, charger un fichier de données une fois que celuici a été déposé sur un serveur, mettre à jour le cache de données d’un dashboard... Mais il peut aussi s’agir d'exécuter un script de traitement de données et stocker les résultats dans un datawarehouse. Comme exemples, on peut citer l’analyse de cohortes ou de parcours clients, le clustering de magasins, un calcul prédictif.... On s’éloigne ici de la notion de datavisualisation pure. Mais pour une majorité de projets, le fait de pouvoir exécuter ces traitements, stocker les résultats et réaliser les dashboards associés sur une même solution est un atout très fort pour l’agilité et le succès du projet. On évite ainsi les problèmes d’échanges de données (et les problèmes de sécurité associés), de multiplicité d’outils et de compétences nécessaires, d’incompatibilité des systèmes. En résumé, on diminue la complexité globale et le temps de mise en oeuvre d’un projet. Ce type de solution unifiée qui répond à cette plage de besoins rentre dans l’appellation BI/DW PaaS (pour Business Intelligence / DataWarehouse PlateformAsAService).
Aujourd’hui, les technologies pour mettre en oeuvre ce genre de plateforme de données existent. Les architectures Cloud basées sur des systèmes distribués, extensibles, virtualisés et asynchrones sont arrivées à maturité. Les Cloud providers comme AWS (Amazon Web Services), Microsoft Azure ou encore Google Cloud sont très performants. Et la technologie de containers Docker permet d’assouplir encore l’orchestration de telles plateformes, notamment sur des Cloud privés.
Pour les éditeurs classiques de BI, on pourrait croire qu’il s’agit d’un choix de positionnement produit de ne pas présenter de plateforme de données Cloud. Mais c’est difficile à croire puisque les solutions traditionnelles de type serveur sont plutôt des plateformes (avec scheduler, systèmes de tâches, des intégrations Python/R...). Ce sont les nouvelles versions Cloud qui ont abandonné cet aspect pour se focaliser sur la selfservice datavisualisation. La course entre éditeurs pour répondre au phénomène Cloud les a certainement amenés à simplifier leurs produits, ne proposant ainsi qu'une solution de datavisualisation en Cloud et nécessitant l'installation desktop/serveur pour bénéficier d’une plateforme plus complète.
Bien sûr pour certains projets, on voudra utiliser le meilleur ETL du marché, avoir des options avancées de nettoyage de données, configurer finement son datawarehouse, gérer son propre système de programmation de tâches et sa propre infrastructure de calcul. Dans ce cas, un BI/DW PaaS sera moins pertinent.
Mais pour de nombreux projets, une plateforme Cloud unifiée incluant un datawarehouse, un module de datavisualisation et un moteur d’automatisation de traitement de données sera plus agile et moins coûteuse tout en restant aussi performante. C’est ce positionnement qu’a choisi par exemple Serenytics en démarrant directement sur une architecture Cloud très moderne. Comme toujours, le choix de la solution dépend du projet et de son contexte. Mais ce type de plateforme est à considérer dans l’éventail des options de Cloud BI.
Adrien Auclair est CEO et cofondateur de la société Serenytics. Diplômé de l’ENSIMAG et docteur en Informatique et Mathématiques Appliquées, il travaille pendant sa thèse sur les bases de données dédiées aux recherches d’images similaires dans des grandes bases. Il commence sa carrière en fondant Planorama, société d’inventaire magasin par la photographie. Fin 2014, il fonde Serenytics, plateforme Cloud de Business Intelligence.