Obsah

·         1 Úvod

o    1.1 Rozdíl mezi fyzickými a logickými disky

o    1.2 Čtení a zápis dat

o    1.3 Co je RAID?

o    1.4 Proč používat RAID?

o    1.5 Historie

·         2 Základní pojmy používané v systémech RAID

o    2.1 Ukládání do mezipaměti

o    2.2 Zrcadlení: Více než jedna kopie dat

o    2.3 Pruhování: Část dat je na jiném disku

o    2.4 Oprava chyb a poruch

o    2.5 Horké zálohy: použití více disků, než je potřeba

o    2.6 Velikost proužku a velikost části: rozložení dat na několik disků

o    2.7 Sestavení disku: JBOD, spojování nebo spojování disků (spanning)

o    2.8 Klonování jednotky

o    2.9 Různá nastavení

·         3 Základy: jednoduché úrovně RAID

o    3.1 Běžně používané úrovně RAID

§  3.1.1 RAID 0 "striping"

§  3.1.2 RAID 1 "zrcadlení"

§  3.1.3 RAID 5 "prokládání s distribuovanou paritou"

§  3.1.4 Obrázky

o    3.2 Méně používané úrovně RAID

§  3.2.1 RAID 2

§  3.2.2 RAID 3 "prokládání s vyhrazenou paritou"

§  3.2.3 RAID 4 "prokládání s vyhrazenou paritou"

§  3.2.4 RAID 6

§  3.2.5 Obrázky

o    3.3 Nestandardní úrovně RAID

§  3.3.1 Dvojitá parita / diagonální parita

§  3.3.2 RAID-DP

§  3.3.3 RAID 1.5

§  3.3.4 RAID 5E, RAID 5EE a RAID 6E

§  3.3.5 RAID 7

§  3.3.6 Intel Matrix RAID

§  3.3.7 Linuxový ovladač MD RAID

§  3.3.8 RAID Z

§  3.3.9 Obrázky

·         4 Spojování úrovní RAID

·         5 Vytvoření pole RAID

o    5.1 Softwarový RAID

o    5.2 Hardwarový RAID

o    5.3 Hardwarově podporovaný RAID

·         6 Různé termíny související se selháním hardwaru

o    6.1 Míra selhání

o    6.2 Střední doba do ztráty dat

o    6.3 Průměrná doba do zotavení

o    6.4 Neobnovitelná bitová chybovost

·         7 Problémy s RAID

o    7.1 Pozdější přidání disků

o    7.2 Související selhání

o    7.3 Atomicita

o    7.4 Neobnovitelná data

o    7.5 Spolehlivost mezipaměti pro zápis

o    7.6 Kompatibilita zařízení

·         8 Co RAID umí a neumí

o    8.1 Co umí RAID

o    8.2 Co RAID neumí

·         9 Příklad

·         10 Odkazy

·         11 Další webové stránky

RAID je zkratka, která znamená Redundant Array of Inexpensive Disks nebo Redundant Array of Independent Disks. RAID je termín používaný v počítačích. Pomocí RAID se z několika pevných disků vytvoří jeden logický disk. To lze provést různými způsoby. Každý ze způsobů, který spojuje pevné disky dohromady, má určité výhody a nevýhody oproti použití disků jako jednotlivých, na sobě nezávislých disků. Hlavní důvody, proč se používá RAID, jsou následující:

  • Aby ke ztrátě dat docházelo méně často. K tomu slouží několik kopií dat.
  • Získání většího úložného prostoru pomocí mnoha menších disků.
  • Větší flexibilita (disky lze měnit nebo přidávat za chodu systému)
  • Rychlejší získání dat.

Není možné dosáhnout všech těchto cílů najednou, a proto je třeba se rozhodnout.

Existují i špatné věci:

  • Určité volby mohou chránit před ztrátou dat z důvodu selhání jednoho (nebo několika) disků. Nechrání však před smazáním nebo přepsáním dat.
  • V některých konfiguracích může RAID tolerovat selhání jednoho nebo několika disků. Po výměně selhaných disků je třeba data rekonstruovat. V závislosti na konfiguraci a velikosti disků může tato rekonstrukce trvat dlouho.
  • Některé druhy chyb znemožňují čtení dat.

Většina prací o RAID vychází z článku z roku 1988.

Společnosti používají systémy RAID k ukládání dat od doby, kdy byla tato technologie vytvořena. Systémy RAID lze vytvořit různými způsoby. Od doby objevu se náklady na vytvoření systému RAID velmi snížily. Z tohoto důvodu mají některé funkce RAID dokonce i některé počítače a přístroje používané v domácnostech. Takové systémy lze použít například k ukládání hudby nebo filmů.

Základní pojmy (stručně)

  • Zrcadlení (mirroring) – data jsou kopírována na více disků (např. RAID 1). Pokud jeden disk selže, data jsou stále dostupná na druhém.
  • Pruhování (striping) – data jsou rozdělena do bloků (stripů) a střídavě ukládána na více disků (např. RAID 0). Zvyšuje výkon I/O, ale neposkytuje redundanci.
  • Parita – informace používané k obnovení dat při selhání disku. U RAID 5 jsou paritní bity distribuovány mezi disky; u RAID 6 jsou dvě sady parity (odolnost proti dvěma selháním).
  • Stripe size (velikost proužku) – velikost bloku dat, která se zapisuje postupně na jednotlivé disky; ovlivňuje výkon při čtení/zápisu malých či velkých souborů.
  • Hot spare – náhradní disk připojený k poli, který se automaticky použije při selhání jiného disku.
  • Rebuild – proces přepočtu a obnovení chybějících dat na nově vložený disk z parity nebo zrcadel.

Nejběžnější úrovně RAID (0, 1, 5, 6)

RAID 0 (striping)

  • Princip: data jsou rozdělena na bloky a rozložena střídavě mezi všechny disky v poli.
  • Výhody: maximální využití kapacity (součet všech disků), vyšší sekvenční i paralelní výkon čtení i zápisu.
  • Nevýhody: žádná redundance — selhání jednoho disku znamená ztrátu dat v celém poli.
  • Použití: dočasné/scratch úložiště, video renderování, tam kde je důležitý výkon a data lze znovu vytvořit.

RAID 1 (zrcadlení)

  • Princip: každý blok dat je zapsán na dva (nebo více) disky jako identická kopie.
  • Výhody: jednoduché obnovení po selhání disku, dobrý výkon čtení (může číst z více kopií současně), jednoduchá správa.
  • Nevýhody: efektivní kapacita je poloviční (dva 2 TB disky = 2 TB dostupné), náklady na disk jsou vyšší.
  • Použití: systémové disky serverů, kritická data, malé NAS zařízení.

RAID 5 (striping s distribuovanou paritou)

  • Princip: data i parita jsou rozloženy mezi všechny disky; k obnovení lze použít paritní informace.
  • Výhody: dobrá kombinace kapacity a ochrany dat; efektivní kapacita = (N-1) × velikost disku pro N disků.
  • Nevýhody: při zápisu je potřeba aktualizovat paritu (tzv. write penalty), při selhání jednoho disku probíhá rebuild, který u velkých disků trvá dlouho a zatěžuje pole; riziko selhání dalšího disku během rebuildu.
  • Požadavky: minimálně 3 disky.
  • Použití: obecné úložiště tam, kde je důležitá kapacita s konkrétní ochranou proti selhání jednoho disku.

RAID 6 (dvojitá parita)

  • Princip: podobně jako RAID 5, ale používá dvě nezávislé paritní informace; odolá selhání dvou disků současně.
  • Výhody: vyšší bezpečnost při použití velkých disků nebo velkých polí; snižuje riziko ztráty dat během dlouhých rebuildů.
  • Nevýhody: vyšší write penalty než RAID 5, efektivní kapacita = (N-2) × velikost disku; potřeba minimálně 4 disky.
  • Použití: velká pole, enterprise NAS, tam kde je pravděpodobnost druhého selhání během rebuildu reálná.

Výhody a omezení RAID

  • Výhody: vyšší dostupnost dat (v závislosti na úrovni), zlepšení výkonu čtení, konsolidace více disků do jednoho logického celku, možnost horké výměny disků a automatické přepojení na hot spare, centralizovaná správa.
  • Omezení: RAID není náhradou za zálohování — nezabezpečí proti omylům uživatele, šifrování selhání, korupci dat nebo výpadku celé jednotky (např. požár, krádež); rekonstrukce polí může být časově náročná a riziková; výkon závisí na konfiguraci, typu řízení a velikosti proužku.

Typy implementace RAID

  • Softwarový RAID – implementován operačním systémem (např. Linux MD RAID, Windows Storage Spaces, ZFS). Výhodou je flexibilita a nižší cena; nevýhodou je zátěž CPU (dnes minimalizovaná na moderních strojích).
  • Hardwarový RAID – specializovaný RAID řadič s vlastním procesorem a cache pamětí. Nabízí často lepší výkon, bateriově zálohovanou cache a pokročilé funkce, ale je dražší a může být proprietární (tíže přenositelné mezi řadiči).
  • Firmware/SoftRAID (pseudo-hardware) – řešení jako Intel Matrix RAID nebo některé kontroléry, které kombinují vlastnosti softwaru a hardwaru; často závislé na ovladačích systému.

Nastavení a doporučení (základní postupy)

Níže jsou obecné kroky a tipy jak RAID nastavit. Konkrétní postupy se liší podle zařízení a softwaru/firmwaru.

  • Plánujte kapacitu a úroveň RAID – stanovte, zda preferujete výkon, kapacitu nebo odolnost. Pro domácí NAS je běžné RAID 1 (dva disky) nebo RAID 5/6 (více disků).
  • Vyberte stejné disky – pro lepší kompatibilitu používejte disky stejné kapacity a podobné rychlosti; při použití odlišných kapacit bude efektivní velikost omezena nejmenším diskem (u většiny RAID řešení).
  • Konfigurace stripe size – pro velké soubory (video, zálohy) volte větší stripe (128–256 KB či víc); pro mnoho malých souborů/DB volte menší (16–64 KB).
  • Write cache – kontrola, zda RAID řadič podporuje bezpečný write-back cache (baterie/kapacitor). Bez baterie je bezpečnější write-through, i když pomalejší.
  • Použití hot spare – pokud chcete minimalizovat čas do automatického rebuildu, přidejte hot spare disk.
  • Monitoring a notifikace – aktivujte e-mail/SNMP upozornění, pravidelně kontrolujte SMART stav disků; rychlá výměna selhaného disku snižuje riziko dalšího selhání.
  • Zálohy – vždy mějte externí zálohu (off-site nebo cloud). RAID zajišťuje dostupnost, ne zálohu.

Praktické kroky pro vytvoření RAID

  • V BIOS/UEFI nebo v RAID řadiči – u serverových či desktopových hardwarových řadičů se RAID nastavuje v BIOSu/firmware řadiče před instalací OS. Vytvoříte nové pole, vyberete disky a úroveň RAID.
  • Ve Windows – Windows Storage Spaces nebo Správa disků (pro jednoduché mirror/JBOD) umožní vytvoření softwarového pole.
  • V Linuxu – mdadm je běžný nástroj pro softwarový RAID; příkazem mdadm --create vytvoříte pole a potom jej naformátujete souborovým systémem (ext4, XFS, ZFS apod.).
  • ZFS/FreeNAS/TrueNAS – ZFS kombinuje RAID-like funkce (RAID-Z, RAID-Z2) s kontrolou integrity bloků (checksums) a snapshoty; doporučen pro NAS a úlohy, kde je důležitá data integrity.
  • NAS zařízení – většina domácích/prosumer NAS (Synology, QNAP) má průvodce, který umožní snadné vytvoření RAID 1/5/6/10 a spravuje hot spares a varování.

Rekonstrukce pole a rizika

  • Při selhání disku v poli s paritou začíná rebuild: data se přepočítají z parity a zapíší na nový disk. Rekonstrukce je čtením a zápisem přes celé pole a může trvat hodiny až dny u velkých disků.
  • Během rebuildu je pole zatíženo zvýšeným I/O a je zranitelnější vůči dalšímu selhání — proto RAID 6/RAID-Z2 nebo hot spare pomáhají snížit riziko ztráty dat.
  • Neobnovitelná bitová chyba (UBER) při čtení velkého objemu dat během rebuildu může způsobit selhání obnovy; moderní systémy (ZFS) používají kontrolní součty, aby detekovaly a opravily poškozené bloky.

RAID není záloha

Velmi důležité: RAID zvyšuje dostupnost a/nebo výkon diskového úložiště, ale nechrání proti lidské chybě (smazání souboru), datové korupci, ransomwaru, záplavě, požáru nebo krádeži. Vždy plánujte zálohovací strategii (3-2-1 pravidlo: 3 kopie, na 2 různých médiích, 1 off-site).

Doporučení na závěr

  • Pro kritická data v malém provozu preferujte RAID 1 nebo RAID 10 (zrcadlování + striping) pro rychlou obnovu a jednoduchost.
  • Pro ukládání velkého objemu dat s vyvážením kapacity a ochrany volte RAID 5 (malá pole) nebo RAID 6 (větší pole) — u větších disků preferujte RAID 6.
  • Pro co nejvyšší datovou integritu zvažte ZFS nebo Btrfs (s kontrolou integrity a snapshoty).
  • Pravidelně testujte obnovení dat ze záloh a sledujte stav disků (SMART), aby se minimalizovalo riziko ztráty dat.

Pokud chcete, mohu doplnit konkrétní postupy pro váš systém (např. příkazy mdadm v Linuxu, nastavení v BIOS RAID řadiči nebo postup v Synology/QNAP GUI). Napište, jaké máte disky/řadič/OS, a připravím podrobný návod.