Plan de continuité d'activité

En informatique, un plan de continuité d'activité, a pour but de garantir la survie de l'entreprise après un sinistre important touchant le dispositif informatique.



Catégories :

Disponibilité (informatique) - Protection et sécurité civiles - Management du système d'information - Cindynique - Assurance

Page(s) en rapport avec ce sujet :

  • Rechercher dans ce site... Plan de continuité d'activité - Plan de secours informatique... Système de back up informatique; Plan de redémarrage... (source : sites.google)

En informatique, un plan de continuité d'activité, a pour but de garantir la survie de l'entreprise après un sinistre important touchant le dispositif informatique. Il s'agit de redémarrer l'activité le plus rapidement envisageable avec le minimum de perte de données. Ce plan est un des points essentiels de la politique de sécurité informatique d'une entreprise.

Article connexe : Plan de reprise d'activité.
Pour consulter un article plus général, voir : Plan de continuité.

Étapes de la mise en place d'un plan de continuité

Analyse de risque et d'impact

Pour qu'un plan de continuité soit réellement adapté aux exigences de l'entreprise, il doit reposer sur une analyse de risque et une analyse d'impact :

Une analyse de risque réussie est le résultat d'une action collective impliquant l'ensemble des acteurs du dispositif d'information : techniciens, utilisateurs et managers.

Choix de la stratégie de sécurisation

Il existe plusieurs méthodes pour assurer la continuité de service d'un dispositif d'information. Certaines sont techniques (choix des outils, méthodes de protection d'accès et de sauvegarde des données), d'autres reposent sur le comportement individuel des utilisateurs (extinction des postes informatiques après usage, utilisation raisonnable des capacités de transfert d'informations, respect des mesures de sécurité), sur des règles et connaissances collectives (protection incendie, sécurité d'accès aux locaux, connaissance de l'organisation informatique interne de l'entreprise) et de plus en plus sur des conventions passées avec des prestataires (copie des programmes, mise à disposition de matériel de secours, assistance au dépannage).

Les méthodes se distinguent entre préventives (éviter la discontinuité) et curatives (rétablir la continuité après un sinistre). Les méthodes préventives sont fréquemment privilégiées, mais décrire les méthodes curatives est une obligation car aucun dispositif n'est fiable à 100 %.

Mesures préventives

Dans le cadre de l'hébergement de leurs infrastructures et/ou applications, plus de 50% des organisations interrogées en 2008 par MARKESS International[1] évoquent avoir besoin des solutions suivantes afin d'assurer la continuité de service de leurs applications métiers et infrastructures informatiques et télécoms sous -jacentes :

Viennent ensuite, par ordre décroissant de citations, les solutions de réplication, mirroring et secours multi-sites ou sur un autre site distant (49%), de basculement sur un réseau de secours (47%), d'analyse de procédures et stratégies assurant la continuité de business (47%), de gestion de bande passante (45%), de sécurité physique et logique (42%) …

La sauvegarde des données
Article détaillé : sauvegarde.

La préservation des données passe par des copies de sauvegarde régulières. Il est important de ne pas stocker ces copies de sauvegarde à côté du matériel informatique, ou alors dans la même pièce car elles disparaitraient en même temps que les données à sauvegarder en cas d'incendie, de dégât des eaux, de vol, etc. Quand il est probable que les sauvegardes disparaissent avec le matériel, le stockage des copies de sauvegarde peut alors être indispensable dans un autre lieu différent et distant.

L'analyse d'impact a apporté des exigences exprimées en temps maximal de rétablissement des ressources après un désastre (RTO Recovery Time Objective) et la perte maximale de données (Recovery Point Objective). La stratégie doit garantir que ces exigences seront observées.

Les dispositifs de secours

Il s'agit de disposer d'un dispositif informatique équivalent à celui pour lequel on veut limiter l'indisponibilité : ordinateurs, périphériques, dispositifs d'exploitation, programmes spécifiques, etc. Une des solutions consiste à créer et maintenir un site de secours, contenant un dispositif en ordre de marche capable de prendre le relais du dispositif défaillant. Selon que le dispositif de secours sera implanté sur le site d'exploitation ou sur un lieu géographiquement différent, on parlera d'un secours in situ ou d'un secours déporté.

Pour répondre aux problématiques de recouvrement de désastre, on utilise de plus en plus souvent des sites délocalisés, c'est-à-dire physiquement scindés des utilisateurs, de quelques centaines de mètres à plusieurs centaines de kilomètres : plus le site est éloigné, moins il risque d'être touché par un désastre affectant le site de production. Mais la solution est d'autant plus chère, car la bande passante qui sert à transférer des données d'un site vers l'autre est alors le plus souvent plus coûteuse et risque d'être moins performante. Cependant la généralisation des réseaux longues distances et la baisse des coûts de transmission rendent moins contraignante la notion de distance : le coût du site ou la compétence des opérateurs (leur capacité à démarrer le secours rapidement et rendre l'accès aux utilisateurs) sont d'autres arguments de choix.

Les sites de secours (in situ ou déportés) se classent selon les types suivants :

Il est aussi envisageable d'utiliser des dispositifs distribués sur plusieurs sites (diminution du risque de panne par effet de foisonnement) ou un site de secours mobile qui correspond à un camion transportant des serveurs et autres dispositifs, servant à n'avoir besoin que d'un dispositif de secours pour plusieurs sites, en tablant sur l'improbabilité qu'une panne touche simultanément plusieurs sites.

Plus les temps de rétablissement garantis sont courts, plus la stratégie est coûteuse. Il faut par conséquent choisir la stratégie qui offre le meilleur équilibre entre le coût et la rapidité de reprise.

D'autre part pour des problématiques de haute disponibilité on a recours aussi à de la redondance mais de manière plus locale.

Il est aussi envisageable de recourir à un site secondaire de haute disponibilité qui se situe le plus souvent près du site de production (moins de 10 kilomètres) pour permettre de les relier avec de la fibre optique et synchroniser les données des deux sites en quasi temps réel de manière synchrone ou asynchrone selon les technologies utilisées, les besoins et contraintes techniques.

Une bonne information et un bon partage des rôles

Quel que soit le degré d'automatisation et de sécurisation d'un dispositif informatique, la composante humaine reste un facteur important. Pour limiter le risque de panne, les acteurs d'un SI (service informatique) doivent adopter les comportements les moins risqués pour le dispositif et peut-être savoir accomplir des gestes techniques.

Mesures curatives

Selon la gravité du sinistre et la criticité du dispositif en panne, les mesures de rétablissement seront différentes.

La reprise des données

Dans cette hypothèse, seules des données ont été perdues. L'utilisation des sauvegardes est indispensable et la méthode, pour simplifier, consiste à réimplanter le dernier jeu de sauvegardes. Cela peut se faire dans un laps de temps court (quelques heures), si on a bien identifié les données à reprendre et si les méthodes et outils de réimplantation sont accessibles et connus.

Le redémarrage des applications

A un seuil de panne plus important, une ou des applications sont indisponibles. L'utilisation d'un site de secours est envisageable, le temps de rendre disponible l'application en cause.

Le redémarrage des machines

Développement du plan

Le plan de reprise contient les informations suivantes :

  1. les dirigeants qui ont autorité pour engager des dépenses,
  2. le porte-parole en charge des contacts avec les tiers : la presse, les clients et les fournisseurs, etc.,
  3. au niveau tactique, les responsables qui coordonnent les actions,
  4. au niveau opérationnel, les hommes de terrain qui travaillent sur le site sinistré et sur le site de remplacement.

La composition de ces équipes doit être connue ainsi qu'à jour, mais aussi les personnes de remplacement et les moyens de les prévenir. Les membres des équipes doivent recevoir une formation.

Exercices et maintenance

Le plan doit être régulièrement essayé au cours d'exercices. Un exercice peut être une simple revue des procédures, peut-être un jeu de rôles entre les équipes de pilotage. Un exercice peut aussi être mené en grandeur réelle, mais peut se limiter à la reprise d'une ressource (par exemple, le serveur principal), ou à une seule fonction du plan (par exemple, la procédure d'intervention immédiate). L'objectif de l'exercice est multiple :

Un plan doit aussi être revu et mis à jour régulièrement (au moins une fois par an) pour tenir compte de l'évolution de la technologie et des objectifs de l'entreprise. L'unique façon efficace de mettre à jour le PCA est d'en sous traiter la maintenance aux métiers afin qu'il soit réactualisé à chaque réunion mensuelle de service.

Plan de Continuité d'Activité ou Plan de Secours Informatique ?

Le Plan de Continuité d'Activité décrit dans cet article n'est en réalité que le volet informatique d'un Plan de Continuité d'Activité complet d'entreprise. Il s'apparente par conséquent à un Plan de Secours Informatique. Un Plan de Continuité d'Activité (ou "Business Continuity Plan") ne se limite pas à la continuité du dispositif d'information, il prend aussi en compte le repli des utilisateurs, le risque sanitaire (pandémie, grippe aviaire), l'organisation donnant la possibilité de la gestion de crise (astreintes, cellules de crise... ), la communication de crise, des mesures de contournement pour les métiers, les fonctions transverses (RH, logistique, etc. ).

Si on prend l'exemple d'une banque dont l'informatique est hébergée sur un site distant et qui voit sa salle des marchés détruite par un incendie, celle-ci déclenchera son Plan de Continuité d'Activité en repliant ses équipes sur un site de secours. Ce site de secours est constitué de positions de travail (le terme "position" représente un bureau, un ou deux écrans, une unité centrale, un téléphone), sur lesquels les utilisateurs pourront poursuivre leur activité : leur numéro de téléphone est transféré sur leur position de secours, l'image de leur poste informatique aura été reconstruite, ils disposeront des lignes de communication nécessaires (réseau interne et externe), le site de secours utilisateur est lui-même relié au site d'hébergement informatique (ou au site de secours si ce dernier est aussi impacté par le sinistre). Pour que le redémarrage informatique soit exploitable par les utilisateurs du dispositif, les aspects techniques doivent être croisés avec l'organisation humaine.

Voir aussi

Références

  1. Référentiel de pratiques : Hébergement à Valeur Ajoutée - Réponse aux Défis de la Continuité de Business 2008

Article connexe

Bibliographie

Liens externes

Recherche sur Amazon (livres) :



Principaux mots-clés de cette page : sites - dispositif - secours - plan - informatique - continuité - données - risque - activité - entreprise - impact - utilisateurs - temps - sauvegarde - analyse - serveurs - équipes - reprise - information - procédures - envisageable - mesure - panne - méthodes - jour - sinistre - stratégie - service - accès - utilisation -

Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Plan_de_continuit%C3%A9_d%27activit%C3%A9_(informatique).
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 17/12/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu