Goof vous propose une série de trois articles pour tout savoir sur qui concerne la technologie R.A.I.D.
Il va vous présenter aujourd'hui en quoi elle consiste.
L'article suivant détaillera son fonctionnement et enfin un dernier article, qui sera réservé aux abonnés, vous détaillera les différents types.
Introduction
Le RAID se démocratise de plus en plus grâce aux NAS, il existe différents constructeurs (Synology, QNAP, Western Digital, ASUS, D-Link, etc…), qui acceptent plus ou moins de disques durs et qui permettent de mettre en place différents types de configurations RAID, selon le nombre de disques que peut accueillir le NAS.
Il est aussi possible de se fabriquer son propre NAS à partir d’un PC (par exemple un « vieux » PC que l’on estime obsolète, peut tout à fait devenir un NAS et retrouver une utilité).
Avant toute chose
Tout ce que je vais présenter ici sera simplifié au maximum. Aussi bien les schémas que les explications. Je ne m’adresse pas à des ingénieurs en informatique.
Donc, pour ceux qui savent déjà ce qu’est le RAID et ses principes de fonctionnement, ne soyez pas surpris.
Cependant, si des experts constatent certaines erreurs, qu'ils n’hésitent pas à me les remonter en commentaires.
Je me ferai une joie de corriger l’article en fonction (après vérification, évidemment).
Je ne prétends pas tout savoir sur le RAID, mais j’estime avoir des connaissances globales suffisantes qui me permettent d’écrire tout ce qui va suivre.
A. Définition / intérêt (Introduction de la tolérance de panne).
Le RAID est un principe qui permet d’agréger (« mettre en commun » ou « combiner ») plusieurs unités de stockage (SSD, disques durs, clés USB, etc…) afin de présenter un stockage unique. (Pour la suite, je vais principalement parler de disques durs, mais c’est tout à fait applicable aux SSD et autres types de stockage)
Les unités de stockage ainsi combinées dans un RAID sont appelées « Grappe de disques » (ou Groupe de disques) ou, plus communément « Grappe RAID ».
La capacité de stockage finale du RAID dépendra :
- Du type de RAID choisi (0, 1, 5, 10 etc…)
- De la quantité d’unités de stockage qui le compose
- De la capacité de chacune des unités de stockage utilisées dans le RAID.
L’intérêt du RAID est, avec ses différentes combinaisons, d’augmenter les performances en termes de lecture/écriture (taux de transfert), ou de mettre en place une tolérance de panne, ou les deux en même temps.
La tolérance de panne, comme son nom l’indique, est la capacité, pour une Grappe RAID, de perdre un ou plusieurs disques durs (selon le type de RAID choisi) sans pour autant mettre en péril l’intégrité des données présentes dans le stockage (par des principes de Redondance ou de Parité)
Dès qu'un disque est hors service (ou sur le point de l'être), le disque est identifié comme défaillant et le RAID passe en mode « dégradé » et il faudra remplacer le ou les disques défectueux, puis « reconstruire » (réparer) la Grappe RAID afin qu’elle revienne à son état de fonctionnement « nominal » (A son état d’origine).
Toutefois, le RAID 0 n’offre aucune tolérance de panne => cf : chapitre III. A. (Le RAID 0).
B. Choses à prendre en compte avant d’envisager la mise en place d’un RAID.
1. La théorie du RAID
Sur le papier, la solution RAID est très intéressante.
Le premier réflexe est de se dire qu’on pourra y mettre toutes ses données (importantes ou non) sans trop de risques, puisque la tolérance de panne permet de conserver l’intégrité des données, malgré le fait qu’un ou plusieurs disques sont devenus défaillants.
Sur le principe, OUI, mais dans la réalité, NON.
Explications :
Le côté « sécuritaire » que propose le RAID, avec la tolérance de panne, n’en fait en aucun cas une solution de stockage unique.
Éclaircissements :
Une grappe RAID peut servir de solution de sauvegarde pour des données présentes ailleurs, par exemple, sauvegarder des données importantes de votre PC vers le RAID (une COPIE de sauvegarde), mais si votre solution NAS/RAID devient votre unique solution de stockage de données, alors il vous faut IMPÉRATIVEMENT, un autre stockage pour faire la sauvegarde des données présentes sur la grappe RAID.
Si vous perdez un disque dans une grappe RAID, que vous remplacez ce disque défaillant par un nouveau et que vous lancez la reconstruction (réparation du RAID), il est possible qu’un ou plusieurs disques tombent en panne pendant cette reconstruction.
La sécurisation des données devient limitée (voire inexistante) en cas de grappe RAID « dégradée ». (Dégradée = en attente d’un disque dur « SAIN » de remplacement)
En effet, durant cette phase, les disques sont mis à rude épreuve, et un contrôle de la « cohérence des données » présentes sur les disques restants est effectué afin de reconstruire les données manquantes, suite au(x) disque(s) perdu(s).
En cas de panne d’un autre disque pendant la reconstruction (décidé par le contrôleur RAID, en fonction de l’état S.M.A.R.T du ou des disque(s)), les données seront perdues pour les RAID les plus courants : RAID 1 (à 2 disques) et RAID 5.
Il ne sera jamais possible de récupérer la donnée manquante, donc une partie d’un fichier sera corrompue, et le fichier deviendra illisible.
Il manquera un morceau de chaque fichier présent, résultat :
- La Grappe RAID est hors service
- Les données sont perdues.
Pendant cette phase de reconstruction, il est aussi possible de découvrir que des « clusters » sont défectueux sur certains disques déjà en place dans le RAID « dégradé ».
Le vice est qu’en cas de clusters défectueux sur un disque, on ne se rendra pas forcément compte tout de suite qu’une donnée est corrompue. (Pour un fichier consulté rarement, par exemple). Le fichier est illisible, mais on ne le sait que quand on tente de le consulter.
Pour simplifier, si vous perdez un nombre de disques supérieur à ce que vous autorise la tolérance de panne correspondante au type de RAID que vous avez choisi, toutes les données présentes dans le RAID seront perdues.
Il est aussi possible que le nouveau disque inséré, bien qu’il soit « neuf/sain », soit rejeté par le RAID lors de la reconstruction (disque défectueux au départ ou mauvaise condition de transport, etc…).
Dans ce cas, les données ne sont pas perdues, mais le RAID restera en mode dégradé, et attendra un nouveau disque sain pour sa reconstruction.
Pour résumer
Une vérification de la cohérence des données présentes sur le(s) disque(s) encore disponible(s) dans la Grappe RAID est effectuée pour recalculer et écrire la donnée manquante sur le nouveau disque en cours d’intégration dans la Grappe RAID existante.
Ce qu’il faut retenir, pour l’instant, c’est que lors de ce processus de reconstruction de la Grappe, le risque de perte(s) de données (partiel ou total) est relativement important, et qu’il est donc indispensable, de faire une sauvegarde des données « vitales » présentes sur le RAID, et ce, Régulièrement ! (En fonction de vos modifications/ajouts de données)
Conclusion
Une Grappe RAID n’est, en aucun cas, une solution de sauvegarde de vos données, à partir du moment où cette Grappe RAID constitue votre unique point de stockage.
Peu importe le type de RAID que vous choisissez, il vous faudra DANS TOUS LES CAS une solution de sauvegarde, à part ! (extérieure à la Grappe RAID concernée).
La solution RAID est un moyen de conserver la pérennité de l’exploitation de vos données, sans avoir à effectuer une restauration complète en cas de panne d’un ou plusieurs disque(s) dur(s), selon le type de RAID choisi.
Cette « sécurisation des données » que présente une Grappe RAID ne doit pas être confondue avec une sauvegarde de données pure et simple.
2. Le choix des disques durs
La seconde chose à prendre en compte est au niveau du choix des disques durs.
La majorité vous dira que pour qu’une solution RAID soit efficace, il faut absolument prendre des disques de même capacité, de même marque et de même série, afin d’avoir des disques, avec, exactement les même caractéristiques techniques (stockage, vitesse de rotation, mémoire cache, et j’en passe…)
Évidemment, des disques d’une même série, strictement identiques à tous les niveaux, fonctionneront de la meilleure manière qu’il soit possible.
Et c’est là qu’est le problème… Car ils seront mis en fonction en même temps, auront potentiellement la même durée de vie, donc, plusieurs disques pourraient tomber en panne en même temps, ou, à un très court intervalle de temps.
Si la série présente une défaillance physique ou firmware (défaut de conception matériel ou logiciel), là aussi, ils l’auront tous…
Certains conseilleront de prendre exactement les mêmes références de disques, d’autres vous conseilleront des marques/modèles différents, c’est à vous de voir.
Quoi qu’il en soit, pensez à prendre au moins un ou deux disques supplémentaires, que vous stockerez bien précieusement, de manière à pouvoir réagir rapidement en cas de panne.
De mon point de vue, avec le recul, je pense qu’il est préférable d’acheter vos disques de marques/modèles/séries différents en prenant en compte :
- La capacité identique des disques :
C’est pratiquement obligatoire.
Il est possible de créer une Grappe RAID avec des disques de tailles différentes, mais cela implique certaines contraintes => cf : chapitre III. K. 1.
- La même vitesse de rotation :
C’est très fortement recommandé pour que les disques aient la même vitesse de traitement en termes de lecture/écriture des données, cependant, le RAID fonctionne très bien avec des vitesses de rotation différentes => cf : chapitre III. K. 2.
- La capacité de cache peut éventuellement être prise en compte (bien que ce ne soit pas vital)
Le reste des caractéristiques n’a que très peu ou pas d’impact sur les performances et peut être ignoré sans se poser de questions.
Goof
Articles suivants :
Tout savoir sur le RAID, partie 2/3 : Le fonctionnement.
Tout savoir sur le RAID, partie 3/3 : les différents types.
Les autres articles de Goof :
***
Edit du 21/09/2020 : je publie à nouveau cet article, créé le 07/06/2019, qui est toujours d’actualité.
Oui, plutôt que de faire une pâle copie de ce que les contributeurs ou moi-même ont publié il y a quelques années, je me suis dit qu'il était plus simple et logique de créer une catégorie Replay qui vous permettra de (re)découvrir les articles les plus importants parmi le millier de disponible actuellement sur Sospc.
SOSPC c'est plus de 2000 articles,
Rejoignez la Communauté à partir de 2 € par mois !
Plus d'infos sur les avantages en cliquant ICI.
Christophe, Administrateur