SOSPC

Tout savoir sur le RAID, partie 1/3

Tout savoir sur le RAID, partie 1/3 : Présentation, par Goof.

Goof vous propose une série de trois articles pour tout savoir sur qui concerne la technologie R.A.I.D.

Il va vous présenter aujourd'hui en quoi elle consiste.

L'article suivant détaillera son fonctionnement et enfin un dernier article, qui sera réservé aux abonnés, vous détaillera les différents types.

Introduction

 

Le RAID se démocratise de plus en plus grâce aux NAS, il existe différents constructeurs (Synology, QNAP, Western Digital, ASUS, D-Link, etc…), qui acceptent plus ou moins de disques durs et qui permettent de mettre en place différents types de configurations RAID, selon le nombre de disques que peut accueillir le NAS.

Il est aussi possible de se fabriquer son propre NAS à partir d’un PC (par exemple un « vieux » PC que l’on estime obsolète, peut tout à fait devenir un NAS et retrouver une utilité).

Avant toute chose

Tout ce que je vais présenter ici sera simplifié au maximum. Aussi bien les schémas que les explications. Je ne m’adresse pas à des ingénieurs en informatique.

Donc, pour ceux qui savent déjà ce qu’est le RAID et ses principes de fonctionnement, ne soyez pas surpris.

Cependant, si des experts constatent certaines erreurs, qu'ils n’hésitent pas à me les remonter en commentaires.

Je me ferai une joie de corriger l’article en fonction (après vérification, évidemment).

Je ne prétends pas tout savoir sur le RAID, mais j’estime avoir des connaissances globales suffisantes qui me permettent d’écrire tout ce qui va suivre.

Tout savoir sur le RAID, partie 1/3 : Présentation

A. Définition / intérêt (Introduction de la tolérance de panne).

Le RAID est un principe qui permet d’agréger (« mettre en commun » ou « combiner ») plusieurs unités de stockage (SSD, disques durs, clés USB, etc…) afin de présenter un stockage unique. (Pour la suite, je vais principalement parler de disques durs, mais c’est tout à fait applicable aux SSD et autres types de stockage)

Les unités de stockage ainsi combinées dans un RAID sont appelées « Grappe de disques » (ou Groupe de disques) ou, plus communément « Grappe RAID ».

La capacité de stockage finale du RAID dépendra :

-     Du type de RAID choisi (0, 1, 5, 10 etc…)

-     De la quantité d’unités de stockage qui le compose

-     De la capacité de chacune des unités de stockage utilisées dans le RAID.

L’intérêt du RAID est, avec ses différentes combinaisons, d’augmenter les performances en termes de lecture/écriture (taux de transfert), ou de mettre en place une tolérance de panne, ou les deux en même temps.

La tolérance de panne, comme son nom l’indique, est la capacité, pour une Grappe RAID, de perdre un ou plusieurs disques durs (selon le type de RAID choisi) sans pour autant mettre en péril l’intégrité des données présentes dans le stockage (par des principes de Redondance ou de Parité)

Dès qu'un disque est hors service (ou sur le point de l'être), le disque est identifié comme défaillant et le RAID passe en mode « dégradé » et il faudra remplacer le ou les disques défectueux, puis « reconstruire » (réparer) la Grappe RAID afin qu’elle revienne à son état de fonctionnement « nominal » (A son état d’origine).

Toutefois, le RAID 0 n’offre aucune tolérance de panne => cf : chapitre III. A. (Le RAID 0).

B. Choses à prendre en compte avant d’envisager la mise en place d’un RAID.

1.   La théorie du RAID

Sur le papier, la solution RAID est très intéressante.

Le premier réflexe est de se dire qu’on pourra y mettre toutes ses données (importantes ou non) sans trop de risques, puisque la tolérance de panne permet de conserver l’intégrité des données, malgré le fait qu’un ou plusieurs disques sont devenus défaillants.

Sur le principe, OUI, mais dans la réalité, NON.

Explications :

Le côté « sécuritaire » que propose le RAID, avec la tolérance de panne, n’en fait en aucun cas une solution de stockage unique.

Éclaircissements :

Une grappe RAID peut servir de solution de sauvegarde pour des données présentes ailleurs, par exemple, sauvegarder des données importantes de votre PC vers le RAID (une COPIE de sauvegarde), mais si votre solution NAS/RAID devient votre unique solution de stockage de données, alors il vous faut IMPÉRATIVEMENT, un autre stockage pour faire la sauvegarde des données présentes sur la grappe RAID.

Si vous perdez un disque dans une grappe RAID, que vous remplacez ce disque défaillant par un nouveau et que vous lancez la reconstruction (réparation du RAID), il est possible qu’un ou plusieurs disques tombent en panne pendant cette reconstruction.

La sécurisation des données devient limitée (voire inexistante) en cas de grappe RAID « dégradée ».  (Dégradée = en attente d’un disque dur « SAIN » de remplacement)

En effet, durant cette phase, les disques sont mis à rude épreuve, et un contrôle de la « cohérence des données » présentes sur les disques restants est effectué afin de reconstruire les données manquantes, suite au(x) disque(s) perdu(s).

En cas de panne d’un autre disque pendant la reconstruction (décidé par le contrôleur RAID, en fonction de l’état S.M.A.R.T du ou des disque(s)), les données seront perdues pour les RAID les plus courants : RAID 1 (à 2 disques) et RAID 5.

Il ne sera jamais possible de récupérer la donnée manquante, donc une partie d’un fichier sera corrompue, et le fichier deviendra illisible.

Il manquera un morceau de chaque fichier présent, résultat :

-     La Grappe RAID est hors service

-     Les données sont perdues.

Pendant cette phase de reconstruction, il est aussi possible de découvrir que des « clusters » sont défectueux sur certains disques déjà en place dans le RAID « dégradé ».

Le vice est qu’en cas de clusters défectueux sur un disque, on ne se rendra pas forcément compte tout de suite qu’une donnée est corrompue. (Pour un fichier consulté rarement, par exemple). Le fichier est illisible, mais on ne le sait que quand on tente de le consulter.

Pour simplifier, si vous perdez un nombre de disques supérieur à ce que vous autorise la tolérance de panne correspondante au type de RAID que vous avez choisi, toutes les données présentes dans le RAID seront perdues.

Il est aussi possible que le nouveau disque inséré, bien qu’il soit « neuf/sain », soit rejeté par le RAID lors de la reconstruction (disque défectueux au départ ou mauvaise condition de transport, etc…).

Dans ce cas, les données ne sont pas perdues, mais le RAID restera en mode dégradé, et attendra un nouveau disque sain pour sa reconstruction.

Pour résumer

 

Une vérification de la cohérence des données présentes sur le(s) disque(s) encore disponible(s) dans la Grappe RAID est effectuée pour recalculer et écrire la donnée manquante sur le nouveau disque en cours d’intégration dans la Grappe RAID existante.

Ce qu’il faut retenir, pour l’instant, c’est que lors de ce processus de reconstruction de la Grappe, le risque de perte(s) de données (partiel ou total) est relativement important, et qu’il est donc indispensable, de faire une sauvegarde des données « vitales » présentes sur le RAID, et ce, Régulièrement ! (En fonction de vos modifications/ajouts de données)

Conclusion

Une Grappe RAID n’est, en aucun cas, une solution de sauvegarde de vos données, à partir du moment où cette Grappe RAID constitue votre unique point de stockage. 

Peu importe le type de RAID que vous choisissez, il vous faudra DANS TOUS LES CAS une solution de sauvegarde, à part ! (extérieure à la Grappe RAID concernée).

La solution RAID est un moyen de conserver la pérennité de l’exploitation de vos données, sans avoir à effectuer une restauration complète en cas de panne d’un ou plusieurs disque(s) dur(s), selon le type de RAID choisi.

Cette « sécurisation des données » que présente une Grappe RAID ne doit pas être confondue avec une sauvegarde de données pure et simple.

Tout savoir sur le RAID, partie 1/3 : Présentation, choix du disque

2.   Le choix des disques durs

La seconde chose à prendre en compte est au niveau du choix des disques durs.

La majorité vous dira que pour qu’une solution RAID soit efficace, il faut absolument prendre des disques de même capacité, de même marque et de même série, afin d’avoir des disques, avec, exactement les même caractéristiques techniques (stockage, vitesse de rotation, mémoire cache, et j’en passe…)

Évidemment, des disques d’une même série, strictement identiques à tous les niveaux, fonctionneront de la meilleure manière qu’il soit possible.

Et c’est là qu’est le problème… Car ils seront mis en fonction en même temps, auront potentiellement la même durée de vie, donc, plusieurs disques pourraient tomber en panne en même temps, ou, à un très court intervalle de temps.

Si la série présente une défaillance physique ou firmware (défaut de conception matériel ou logiciel), là aussi, ils l’auront tous…

Certains conseilleront de prendre exactement les mêmes références de disques, d’autres vous conseilleront des marques/modèles différents, c’est à vous de voir.

Quoi qu’il en soit, pensez à prendre au moins un ou deux disques supplémentaires, que vous stockerez bien précieusement, de manière à pouvoir réagir rapidement en cas de panne.

De mon point de vue, avec le recul, je pense qu’il est préférable d’acheter vos disques de marques/modèles/séries différents en prenant en compte :

-     La capacité identique des disques : 

C’est pratiquement obligatoire.

Il est possible de créer une Grappe RAID avec des disques de tailles différentes, mais cela implique certaines contraintes => cf : chapitre III. K. 1. 

-     La même vitesse de rotation :

C’est très fortement recommandé pour que les disques aient la même vitesse de traitement en termes de lecture/écriture des données, cependant, le RAID fonctionne très bien avec des vitesses de rotation différentes => cf : chapitre III. K. 2. 

-     La capacité de cache peut éventuellement être prise en compte (bien que ce ne soit pas vital)

Le reste des caractéristiques n’a que très peu ou pas d’impact sur les performances et peut être ignoré sans se poser de questions.

Goof

avatar GOOF

Articles suivants :

Tout savoir sur le RAID, partie 2/3 : Le fonctionnement.

Tout savoir sur le RAID, partie 3/3 : les différents types.

Les autres articles de Goof :  

autres articles

***

windows uninstaller

Edit du 21/09/2020 : je publie à nouveau cet article, créé le 07/06/2019, qui est toujours d’actualité.

Oui, plutôt que de faire une pâle copie de ce que les contributeurs ou moi-même ont publié il y a quelques années, je me suis dit qu'il était plus simple et logique de créer une catégorie Replay qui vous permettra de (re)découvrir les articles les plus importants parmi le millier de disponible actuellement sur Sospc.

SOSPC c'est plus de 2000 articles,

Rejoignez la Communauté à partir de 2 € par mois !

Plus d'infos sur les avantages en cliquant ICI.

Christophe, Administrateur

16 Commentaires
le plus récent
le plus ancien le plus populaire
Inline Feedbacks
View all comments
José

Aaaah !!! Voilà cet article que j'attendais depuis des mois et des mois, enfin voilà qui va me passionner pour cette série. Je vous remercie du fond du cœur Mr GOOF de vous pencher sur le RAID; depuis quelques environs 3 ans que je voudrais monter un serveur avec plusieurs HDD de plus de 10 To, avec un PC qui date d'environs 8 ans,mais dont la CM le Chipset et le CPU et de loin bien supérieur aux configurations NAS dont celles-ci sont composées de CELERONS 4Go de RAM au max; ou autres Pentiums. J'espère avoir ce que je recherche,… Lire la suite »

Goof

Hello José,

Il était prévu, un chapitre 4 "Monter un NAS maison", mais je manque cruellement de temps pour le faire (pour l'instant)
Un chapitrage aura probablement lieu quand j'expliquerais tout ça.

C'est prévu. Mais histoire que ça ne prennent pas (encore) des années…
J'ai coupé ce chapitre pour publier l'article, sinon, vu mon planning actuel, il fallait attendre un an de plus.…

José

Bonjour Mr. Goof, j'espère de tout mon cœur que tu ne va pas nous laisser sur notre faim. Perso, quand je fait un boulot je met toute mon âme et mon cœur, pour que tout fonctionne correctement même si je doit chercher pendant des jours ou des semaines, pour y arriver. Je tiens trop à ce sujet que tu a bien commencé, vaut mieux prendre le temps qu'il faut pour faire les choses convenablement que d'induire les affiliés de ce cite, en erreur, car sur le net on dit beaucoup des âneries, que des vrais solutions aux problèmes de ce vaste… Lire la suite »

Goof

Hello José, Non ! Je vais le faire ce chapitre 4… Mais il faut du temps et de l'investissement (personnel !!) J'ai 2 NAS maison (19To de stockage en tout) et je prendrai des photos de tout cela pour vous montrer ce qu'il est possible de faire à moindre frais. Il est aussi prévu de présenter l'OS NAS OpenMediaVault que j'utilise, et si j'arrive à dégager suffisamment de temps, FreeNAS. Ce sont les deux OS principaux pour le NAS maison. Mais, patience SVP :) Pour ta config NAS Maison : Donc, si j'ai bien identifié le CPU chez Intel c'est un CPU… Lire la suite »

José

Bonjour Mr Goof, comme déjà dit, j'ai un pc qui fonctionne très correctement avec Intel i7 (je pense que c'est un 4 core) 2600K, 16 Go, CM Asus Z68 Pro. Je voudrais donc l'utiliser pour faire un serveur maison pour commencer, et puis pourquoi pas l'utiliser également pour transférer des fichiers pour des amis qui pourraient se connecter et télécharger des fichiers que je métrais à leurs disposition, bien entendu il faudrait les logiciels adéquats pour faire tourner tout ça et le sécuriser il va de soie. Pour la consommation d'électricité j'ai vu sur ce site qu'il existe un logiciel qui permettrait… Lire la suite »

Goof

Hello José, Le core i7 2600k (comme annoncé chez Intel) est un quad core mais présente 8 threads (donc 8 vCPU => Virtual CPU). Dans, les faits, c'est un processeur 8 coeurs (déguisé). Tu peux désactiver l' "Hyper Threading" dans le bios pour n'avoir que les 4 vrais "core" sur la machine au final. (Est-ce que ça consommera moins ? je ne saurais pas répondre…) Pour la conso electrique, oui, tu peux planifier des périodes stop/start. Pour ça, il faut que tes périphériques réseau gèrent le Wake On Lan (WoL) C'est géré par un switch ou une box internet (je… Lire la suite »

JosGama

Eh oui, comme quoi y a plus dans deux Têtes que dans une :yahoo: . Il y a longtemps que beaucoup des questions me sont venues à l'esprit mais j'avais besoin d'un spécialiste pour pouvoir les présenter et si possible les concrétiser.
Je vais lire la 3ème partie et réfléchir pour voir comment m'y prendre.
En tous cas je te remercie pour cet excellent article.

Thierry

Bonjour Goof :bye:
Excellent article :good:
J'attends la suite

Mia

Bonjour Goof, Merci pour cet article très instructif. Mais après lecture, je ne suis pas tentée par l'aventure. Il m'avait semblé comprendre qu'il ne s'agit pas d'une solution de sauvegarde, ce que tu confirmes. Réinstaller une sauvegarde en cas de panne du disque me semble au final plus simple que d'installer un système RAID. Avec Timeshift c'est tellement simple, je l'ai fait plusieurs fois, plus simple c'est impossible. Ceci dit, je n'ai jamais eu affaire à un disque défectueux . On lit souvent que la durée de vie d'un HDD est de 5 ans, je suis tombée sur des perles… Lire la suite »

Goof

Hello Mia,

Je trouve que tu vas un peu vite sur ta réflexion par rapport a une simple "introduction" du sujet.
Attends de voir les différents fonctionnement pour te faire une idée précise…
Tu y verras peut être plus clair après ;)

Bernard

Bonjour Goof, Excellent article qui explique clairement quelque chose d'à la fois de simple et complexe. J'aurais malgré tout 2 petites remarques La 1ère, pourquoi limiter le RAID à des serveurs NAS (Network Attached Storage) livré du moins pour ceux que j'ai vu avec un OS plus ou moins compatible avec Windows et généralement issu du monde Linux et consultable qu'à travers une connexion Internet), ce qui implique une sécurité/confidentialité plus ou moins réduite). En ce qui me concerne je possède une ICY Box contenant 2 DD en RAID 1 et vu par l'explorateur de fichiers comme un seul DD.… Lire la suite »

Goof

Hello Bernard, Il était prévu, un chapitre 4 "Monter un NAS maison", mais je manque cruellement de temps pour le faire (pour l'instant) Un chapitrage aura probablement lieu quand j'expliquerais tout ça. Concernant ta 2e "suggestion", les WD RED ne sonrt pas plus é"pro" ques les Black / Purple / yellow … ou toutes autres couleurs de l'arc-en-ciel.… Quand un disque tombe en panne, il est considéré comme HS… Peu importe sa durée de vie annoncée ! S'il est mal entretenu / mal traité (par les transports ou par le manipulateur) / mal refroidi, il tombera en panne prématurément. Peu importe le type… Lire la suite »

Serge51

Salut Goof ,

Merci pour cet excellent article sur cet technologie particulière. On doit pouvoir effectuer les mêmes configurations avec des SSD . Bien sur les capacités actuelles sont encore limitées , mais !

AZAMOS

Bonjour Goof, :bye:

Première partie vraiment très intéressante ; il me tarde la suite.

Expliquer le RAID n'est pas une sinécure, et ici tu as réussi à l'exposer clairement. :good:

Je connais 2 entreprises à qui je répète sans cesse de faire des sauvegardes externes très régulières, mais je sais qu'elles ne le font pas. Tôt ou tard elles s'en mordront les doigts, mais on ne pourra pas dire qu'elles n'étaient pas au courant. :-(

Merci !

Goof

Hello Azamos,

Ca va arriver, je fais confiance à @admin ;)