Actualités : analyse de données, Business Intelligence, Data Science, Big Data


Migrer vos projets Big Data vers le Cloud


Rédigé par Juvénal CHOKOGOUE le 4 Février 2020

Après plus de 5 ans maintenant, il apparaît clairement que la meilleure façon de rentabiliser ses données dans le contexte du Big Data consiste à distribuer le stockage des données et à paralléliser leur traitement dans un cluster.



Juvénal CHOKOGOUE
Juvénal CHOKOGOUE
Le coût du matériel informatique a considérablement baissé. Il est passé en 1978 de 450 euros pour 1 GHz de processeur à 43 euros en 1985, pour se retrouver à 2,5 euros en 1995. Aujourd’hui il est à moins d’1 euro. En plus d’avoir rendu commode la puissance de calcul, cette baisse des coûts des ressources informatiques permet aujourd'hui aux entreprises à moyen et faible budget d'acquérir les technologies du Big Data sur la base d’un coût variable et de les déployer dans le Cloud. En effet, la baisse des coûts des ressources IT est intervenue au même moment qu’apparaissait un nouveau modèle de facturation des solutions logicielles, le modèle « Pay as you Go », dans lequel le paiement annuel de licences d’utilisation d’un logiciel déployé sur les machines du client était remplacé par le paiement à l’usage d’un logiciel centralisé, et opéré directement par son éditeur.

Vous pensez migrer votre projet [Big] Data vers le Cloud ? Lisez cette chronique avant d’y procéder.

1 - LE CLOUD : UNE TENDANCE SOCIALE CONFIRMEE
Le Cloud fait désormais partie des phénomènes qui vont façonner de façon durable notre société dans l'ère numérique. Les chiffres du Gartner et du Forrester sont formels là-dessus. Grâce au Cloud Computing, les entreprises, aussi bien petites que grandes, qui ont des Budgets IT serrés, ont désormais l’opportunité d’acquérir les technologies dont elles ont besoin sur la base d’un coût variable. De nombreux éditeurs logiciels du Big Data aujourd’hui profitent également de la baisse des coûts de ressources informatiques pour offrir leur solution dans Cloud. Ainsi, le Cloud est devenu une alternative suffisamment sérieuse pour être prise en considération.

A titre de rappel, le Cloud Computing se définit simultanément sur deux axes : un axe économique et un axe technique. Sur le plan économique, le Cloud Computing c’est de la location (ou leasing) des ressources informatiques sous forme de service et facturée à l’usage. Sur le plan technique, le Cloud c’est de la virtualisation de l’excédent de ressources informatiques d’un fournisseur IT.

Commercialement parlant, les services Cloud correspondent à l’excédent des ressources IT, empaquetés sous forme de service Web, avec un accès contrôlé par une API. L’exploitation de ces services Cloud fait l’objet d’une facturation fonction du volume de ressources utilisées, par exemple le nombre de requêtes HTTPS adressées à l’API par minute, la puissance de calcul consommée par heure, la quantité de mémoire utilisée par semaine, …etc. A partir de cette configuration, les entreprises qui fournissent des services Cloud (appelés formellement des fournisseurs Cloud) définissent des offres Cloud qui correspondent à des tarifications d’accès à des quantités précises de ressources dans un intervalle de temps. La figure suivante illustre la taxonomie des offres cloud.

taxonomie des services Cloud
taxonomie des services Cloud
Clairement, grâce à cette taxonomie de produits, le déploiement de l'IT dans le Cloud apparaît aujourd'hui comme étant un modèle rentable économiquement pour les entreprises. Le Big Data ne fait pas exception. Vous avez vu ce qui est arrivé à Cloudera et MapR pour n'avoir pas transformé leur offre Big Data en modèle Cloud…

2 - BIG DATA ON PREMISE OU BIG DATA AS A SERVICE ?
Dans les paragraphes précédents, nous faisons intuitivement l'hypothèse que le déploiement des ressources IT en as a Service est le modèle qui fournit le retour sur investissement le plus important par rapport au modèle on Premise, et cela est vrai ! Cependant, cela élude le fait que pour déployer toute la stack technologique nécessaire pour valoriser vos données, vous avez le choix entre 2 modèles : le modèle de déploiement on Premise et le modèle de déploiement as a Service. Que ce soit l’un ou l’autre, la manière de mettre à disposition les logiciels et le matériel informatique aux mains des employés pour valoriser vos données aura un impact conséquent sur le budget de l’entreprise, et son niveau de contrôle sur son actif le plus précieux actuellement : la data.
Le gros inconvénient du modèle de déploiement On Premise est le transfert de responsabilité de garantie de niveau de service, du fournisseur ou de l’éditeur IT vers l’entreprise. Cela implique la mise en place des processus métiers au sein de l’entreprise pour la gestion des ressources IT (les processus de recrutement, de gestion de carrière, etc).
Grâce au modèle de déploiement as a service du Cloud par contre, les éditeurs peuvent transformer leurs applications du livrable On premise en services Web, mises à disposition de leurs utilisateurs au travers de terminaux connectés à Internet, selon la taxonomie IaaS, PaaS ou SaaS. Cela offre aux systèmes d’information des entreprises la flexibilité nécessaire pour pouvoir absorber les pics et creux non-anticipés associées aux fluctuations de l’activité de l’entreprise.

3 - LE CLOUD AU SERVICE DE L’ESPIONNAGE NATIONAL ?
Tous les avantages du modèle as a Service peuvent rapidement faire oublier qu'il existe des inconvénients tout aussi sérieux que ses avantages.

Malheureusement, l’utilisation du Cloud (spécialement en modèle SaaS) demande souvent la délocalisation du patrimoine le plus important de l’entreprise : la donnée. En effet, la souscription d'un service cloud va souvent nécessiter la souscription additionnelle d'un Object Store c’est-à-dire un service de stockage en ligne (par exemple Azure BLOB, Amazon S3, Google drive, etc...), car par défaut, les résultats des traitements en cloud ne sont pas sauvegardés. Vous devez donc utiliser un Object Store pour persister vos données. Sauf dans le cas d'un Cloud Hybride, les données contenues dans l'object store sont souvent stockées dans les serveurs internes du fournisseur Cloud. Ce qui implique que vous perdez le contrôle sur ce que celui-ci fait de vos données. Plus encore, vous n'avez pas de contrôle sur la localisation de vos données. Les fournisseurs sont souvent obligés de géo-répliquer vos données pour garantir la haute disponibilité du service cloud. Une fois que vos données sont hébergées chez le fournisseur, vous n'avez plus de contrôle sur elles.

En Juin 2013 (ça ne fait pas si longtemps que ça), Edward Snowden, un jeune informaticien de la NSA a révélé des documents confidentiels qui montraient que son Etat, l'Etat américain nous espionne. Cet espionnage est en majorité basé sur les données stockées dans le Cloud des entreprises américaines. Ainsi, malgré tous ses avantages, le Cloud présente des dangers sérieux !

En conclusion de cette chronique, ce qu’il faut retenir c’est que le déploiement de l'IT dans le Cloud apparaît aujourd'hui comme un modèle rentable économiquement pour les entreprises malgré ses risques. Migrer son projet [Big] Data dans le cloud apparaît désormais comme une option tout à fait envisageable.

Vous travaillez sur un projet Big Data ? Vous comptez délocaliser vos déploiements Hadoop vers le Cloud ? Cliquez ici pour recevoir un guide spécialisé dans lequel nous vous expliquons de A à Z la stratégie pour migrer avec succès votre projet Big Data vers le Cloud. https://www.data-transitionnumerique.com/big-data-cloud/





Nouveau commentaire :
Twitter

Vous pouvez commenter ou apporter un complément d’information à tous les articles de ce site. Les commentaires sont libres et ouverts à tous. Néanmoins, nous nous réservons le droit de supprimer, sans explication ni préavis, tout commentaire qui ne serait pas conforme à nos règles internes de fonctionnement, c'est-à-dire tout commentaire diffamatoire ou sans rapport avec le sujet de l’article. Par ailleurs, les commentaires anonymes sont systématiquement supprimés s’ils sont trop négatifs ou trop positifs. Ayez des opinions, partagez les avec les autres, mais assumez les ! Merci d’avance. Merci de noter également que les commentaires ne sont pas automatiquement envoyés aux rédacteurs de chaque article. Si vous souhaitez poser une question au rédacteur d'un article, contactez-le directement, n'utilisez pas les commentaires.


Twitter
Rss
LinkedIn
Facebook
Apple Podcast
App Store
Google Play Store