Un nuage dans le ciel du Cloud


Rédigé par Richard STONE, Compuware le 13 Janvier 2012

Richard Stone, Cloud Solutions Director chez Compuware, expose les conséquences des pannes dans le Cloud.



Richard STONE, Cloud Solutions Director chez Compuware
Le 21 avril 2011, les clients du service EC2 d'Amazon en Virginie du Nord ont été confrontés à de forts ralentissements et d'importantes défaillances de leurs applications hébergées en Cloud. FourSquare, Reddit, Quora, HootSuite ainsi que d'autres grands sites Internet se sont révélés inaccessibles sans que personne ne sache pourquoi.
Sur le moment, Amazon n'a fourni aucune explication sur cette paralysie de quatre jours et n'a invoqué qu'ultérieurement l'échec d'une mise à jour logicielle dans son centre de données basé en Virginie du Nord. Malgré la résilience du service EC2, cet événement a eu de graves répercussions. Si la sécurité des données n'a pas été remise en question, comme c'est souvent le cas lorsqu'on s'acharne sur le Cloud, la panne a montré les répercussions dramatiques que peut occasionner le moindre problème de performance dans la « chaîne de distribution » du Cloud.

À l'instar des autres services informatiques, les services de Cloud ne sont pas à l'abri d'une défaillance. Même si le modèle EC2 d'Amazon jouit d'une belle popularité, sa disponibilité n'est pas garantie à 100 %. Le Cloud computing permet certes une mise en œuvre rapide et un accès aisé aux applications et contenus dynamiques, mais il présente aussi quelques vulnérabilités.
Il ne faut pas oublier que les données et applications hébergées en mode Cloud ne sont pas limitées à leur propre espace et à leur propre centre de données. Dans un environnement où les ressources sont partagées, la moindre brèche peut affecter l'ensemble des plates-formes. La chaîne de distribution du Cloud est complexe et se trouve souvent en dehors du contrôle direct du propriétaire de l'application.
Avant de rejoindre la communauté du Cloud computing, les entreprises doivent être conscientes de cette « co-dépendance » et être capables de s'y adapter. Il est indispensable de cerner les problèmes potentiels, mais surtout de savoir les résoudre. Par exemple, une entreprise constatant des baisses de performances ou un ralentissement du service de Cloud devrait pouvoir identifier les éventuelles mesures à prendre. Ce n'est cependant pas toujours pas le cas, comme l'ont récemment déploré nombre de clients d'Amazon.

Parrainée par Compuware, Cloudsleuth (www.cloudsleuth.net) est une communauté de Cloud computing en ligne qui facilite la résolution de ces problèmes en mettant en lumière les causes d'une gestion et de performances applicatives médiocres.

Plusieurs services gratuits sont proposés, parmi lesquels Global Provider View, qui permet de suivre l'actualité et les performances du cloud computing et des principaux fournisseurs dédiés. L'outil en ligne permet en outre d'obtenir des informations détaillées sur les performances de chaque service par zone géographique.

En novembre 2010, alors que WikiLeaks était au cœur de l'actualité, Global Provider View a révélé que les clients d'Amazon avaient subi une baisse de performances ou un ralentissement des temps de réponse de 58 % le 29 novembre, suite sans doute aux cyber-attaques contre le site WikiLeaks, à l'époque hébergé sur le cloud d'Amazon.

Cet exemple montre une fois de plus les répercussions que peut avoir un dysfonctionnement dans la chaîne de distribution du cloud sur les autres parties impliquées mais aussi sur l'expérience des utilisateurs finaux. Les clients d'Amazon auraient été certainement ravis d'avoir cette information au moment des faits. Ce type d'outil permet aux entreprises de mieux appréhender le cloud et de mieux contrôler les éventuels incidents. En identifiant des problèmes mineurs (allongement des temps de réponse, diminution de la bande passante du réseau, etc.), elles peuvent prendre les mesures nécessaires avant que le service ne devienne complètement indisponible. Elles n'ont d'ailleurs aucun intérêt à attendre que le fournisseur leur signale un problème, car le mal est alors déjà fait.

Les problèmes de gestion classiques ne doivent pas les dissuader de rejoindre la communauté du cloud ou les inciter à la quitter. Avant de chercher à limiter les risques, les entreprises doivent cerner les problèmes susceptibles de se produire avec le nouveau modèle. Il est bon de prévoir un « plan B » et de le mettre à exécution en cas de panne d'un service stratégique. Les services de cloud computing font partie d'une grande chaîne où la moindre défaillance peut s'étendre à tous les maillons qui la composent.

La panne du centre de données en Virginie du Nord et la folie médiatique autour de WikiLeaks ont bien montré la vitesse à laquelle un incident peut se propager. Les entreprises doivent en tirer les leçons et prendre les précautions qui s'imposent pour tirer pleinement parti du cloud computing.



Dans la même rubrique :