RAIDのLINEスタンプ作成ならスタンプファクトリー

RAID

RAID（Redundant Arrays of Inexpensive Disks、または Redundant Arrays of Independent Disks、レイド）は、複数台のハードディスクを組み合わせることで仮想的な1台のハードディスクとして運用し冗長性を向上させる技術。ディスクアレイの代表的な実装形態で、主に信頼性・可用性の向上を目的として用いられるものである。本記事において、「装置」という語句を用いるが、これはRAIDが取り付けられる機器（サーバ・ワークステーション・パソコンなど）の総称を意味する。1988年にカリフォルニア大学バークレー校のデイビッド・パターソン, Garth A. Gibson, Randy H. Katzによる論文「A Case for Redundant Arrays of Inexpensive Disks (RAID)」において提唱された。この論文は、安価で低容量、価格相応の信頼性のハードディスクドライブ (Inexpensive Disk) を用い、大容量で信頼性の高いストレージ（補助記憶装置）をいかに構築すべきかを提案したものである。論文にはハードディスクの構成によって、RAID 1からRAID 5までの5種類を定義している。また、論文では提案されていないが、ストライピングのみの場合も一般的にはRAIDの一種とみなされ、これは冗長性が確保されないことからRAID 0と呼ばれる。はじめに定義された6種類のうち、RAID 2はほとんど利用されず、RAID 3・RAID 4もRAID全体の中では少数派である。今日ではRAID 0・RAID 1・RAID 5、およびこれら3方式の組み合わせが用いられている。後にRAID 5を拡張したRAID 6が定義され、RAID 5より耐障害性が必要な場面で利用されている。導入を検討するユーザにとっては、信頼性・速度・予算（ハードディスクの利用効率も含む）の内どれを重視するかを考え、実情にあわせた導入方法を選択することができる。3つを完全に満たすのは難しいが、2つを満たす現実的な方法は充分にある。RAIDの構成によっては、一部のハードディスクが故障しても仮想ディスクは稼動できることがある。その場合、仮想ディスクを稼働させたまま故障したハードディスクを取り外して代わりのハードディスクに交換することにより装置を停止することなく運用を続けることができる。このように装置が稼働中に接続しなおして、即座に利用できる機能を「ホットスワップ（活線挿抜）」と呼ぶ。ホットスワップ機能を使用するには装置側でハードウェアとして対応していることが前提となるため、サーバ用途など24時間連続稼働が求められる装置ではホットスワップが実質的に標準装備となっている。RAIDは、大容量データの高速処理や耐障害性の向上を必須要件とする大規模な業務用サーバやワークステーション、特定目的に製造されたコンピュータ機器等に用いられていたが、近年、小規模サーバやパソコンにも普及しつつある。RAIDは複数のHDDを用いて、仮想ディスクの故障する可能性を低減させる技術である。そのため、ファイルの誤消去など人為的なもの、コンピュータウイルスによるファイルの破壊、ファイルシステムの不整合など、ソフトウェア的な障害には対応できない。またHDDが同時期に複数故障する、リビルド時に他のHDDが障害を起こす等、単体のHDDに比べれば非常に低いが仮想ディスクも故障の可能性を持つ。一方でバックアップは、データを静的な状態で、一定期間、複数世代、保存するものであり、RAIDとは役割が異なる。データはRAIDとバックアップの両者を組みあわせて運用することにより、サービスの継続性を保証しつつ、高い安全性を持って保全することができる。RAIDを実装する方法としては、ハードウェアで実現する方法（ハードウェア方式）とソフトウェアで実現する方法（ソフトウェア方式）がある。この2方式は明確に分類できるものではなく、中間的な方式がいくつか存在する。ハードウェア方式は、RAIDコントローラカードを使用するものとディスクアレイユニットを用いる2方式が存在する。この方式は、RAIDコントローラと呼ばれるカードを装置に取り付け、パリティ演算やディスクの管理などを任せるものである。一部のマザーボードにはRAIDコントローラをあらかじめ実装している製品がある。純粋なハードウェア方式では、ホストが僅かな指示を送るだけでRAIDコントローラが具体的な処理を全て行うため、CPUの負荷が低減される。しかし、コントローラ毎に制御方法が異なるため、OS側で各RAIDコントローラカードへの対応が必要であり、専用のデバイスドライバが必要となる。一方、RAIDコントローラカードの中には、RAID機能の大部分をソフトウェアで実現しているものもある。この場合、OS起動前にRAID機能を使用可能であるがCPUの負荷はソフトウェア方式と大差ない。このため、ソフトウェア方式に分類される。コンピュータやOS側からは単なるSCSIやファイバーチャネルのドライブとして見えるため、特別なドライバが必要なく、CPUへの負荷が全くない。更に、ホットスワップやホットスペアはもとよりオートリカバリ機能を備えているため、運用コストをも低減することが出来る。ディスクアレイユニット内のハードディスクが故障した場合は、シリアルポートやイーサネットを通じて状態を監視ソフトに通知する機能が備わっている。また、ディスクアレイユニットの中にはデファレンシャルSCSIやファイバーチャネルを使い、2台のサーバで1台のディスクアレイユニットを共有出来るものもある。複数台のディスクアレイユニットを組み合わせて専用の制御用サーバがセットになったものもある。ディスクアレイユニットを接続したい装置に必要な外部接続インタフェースがすでにあれば装置の筐体を開けることもなく、ケーブルをつなぐだけで使えるようになる。純粋なソフトウェア方式は、OS自身が普通のドライブコントローラ（IDE、SCSI、FC など）を通して複数台のディスクを管理する。この方式はハードウェア方式と比較し、CPUへの負荷が高いが、特別なハードウェアを購入する必要がないという利点がある。上記の純粋なソフトウェア方式以外のソフトウェアRAIDの実現には、ファイルシステム・単体ソフトウェア・チップセット・増設RAIDボードなど複数の方式が存在する。Windowsは、NTFSファイルシステムにおいてRAID機能をサポートしている。Linuxは、カーネル（2.4系以降）にてRAID0/1/4/5/6をサポートしている。FreeBSDは、gmirrorというソフトウェアにてサポートしている。ファイルシステムのZFSもNTFS同様に自身でRAID機能をもち、RAID5またはRAID6相当の機能としてRAID-ZまたはRAID-Z2が実装されており、ZFS自身の機能もあいまってUSBメモリを何本もUSBポートに挿してRAID化してしまうという離れ業さえ容易である。インテルのチップセットでは、マトリックス・ストレージ・マネージャー機能によりRAID機能をサポートしている。Adaptecの低価格RAIDボードでは、HostRAIDによりソフトウェアRAIDを行っている。近年、サーバ向けチップセットだけでなくメインストリーム向けのチップセットでもRAIDコントローラ機能（0/1/0+1/5など）を集積したものが広く普及しつつある。インテルのチップセットでは、マトリックス・ストレージ・マネージャー機能によりRAID機能をサポートしている。基本的な構造はMUX（マルチプレクサ）/DEMUX（デマルチプレクサ）で構成されており、CPUが発行したディスクI/O操作を複数のハードディスクへのディスクI/Oに分散・またディスクからの読み出しの多重化を行う（パリティ演算機能を持つものと持たないものがある）。信頼性はもとより、ディスクI/O速度を高速化する総合アクセラレータ的要素が強い。このため、ソフトウェア方式に分類される場合が多い。ハードディスクの必要台数が増えるため、特にRAIDコントローラカードを用いて装置内部にハードディスクを取り付けている場合、電源がハードディスク台数分の負担に耐えられるか注意すべきである。ハードディスクが最も電力を必要とするのは起動時であるため、スタッガードスピンアップ（各ディスクに時間差を置いて起動する）機能を搭載しているRAIDコントローラも多い。RAID 0からRAID 6まで7種類のうち、よく利用されるのはRAID 0・RAID 1・RAID 5・RAID 6で、RAIDコントローラやソフトウェアによって使用できるレベルが限定されている場合が多い。各RAIDレベルを組み合わせて信頼性と速度を両立させることができる。サーバ用途としては、データの保全性を重視するためRAID 1またはRAID 5が主に利用されている。サーバ台数の限られた環境で、一台のサーバにかかる負担が高い場合はこれらにRAID 0を組み込んで高速化を狙うケースもある（もちろんサーバ自体を増設して、一台あたりの負担を軽減することも検討すべきであり、負荷の度合い・設置場所の都合・予算などを多角的に検討する必要がある。単にRAID 0をかぶせて高速化することだけに過度の期待を寄せるべきではない）。RAIDの方式によらず、サーバ用途の場合はトラブル発生時に速やかなハードディスク交換を実施できる態勢を採るのが重要であり、ホットスペアやホットスワップ対応の製品を用いるのが望ましい。また、ある種のアプリケーションは、制御情報はRAID 1またはRAID 5のファイルシステムに保存し、マルチメディアデータはRAID 0に保存するとともにテープや光メディアにバックアップしている。RAID 0は複数台のハードディスクに、データを分散して読み書きし高速化したものである。これをストライピングと呼ぶ。冗長性がなく耐障害性もないためRAIDには含まれないとされるが、ストライピングの実装要素（ハードウェアおよびソフトウェア）はRAIDシステムのそれらを転用できるため、他のRAIDモードとともに実装しているコントローラが多い。その場合は他のRAIDモードに比して冗長性を持たないことを明示する意味で、無を表現する数の概念であるゼロが付されRAID 0と呼ばれる。RAID 0には最低2ドライブが必要である。1台のドライブが故障しただけでアレイ内の全データが失われてしまうため、故障率は単体ドライブに比べ高い。例えば、ある条件で一定期間使用した場合におけるドライブの故障率が1%だったとした場合、1台ならば故障率は1%だが、2台でRAID 0を構成した場合は約2% (1-0.99*0.99=0.0199) となり故障率は約2倍に上昇する。単独のRAID 0では速度は向上するものの信頼性（対故障性）が低下することから、後述のRAID 1やRAID 5などを速度の向上を図る目的でストライピング化した形で用いられることも多い。RAID 1は複数台のハードディスクに、同時に同じ内容を書き込む。これをミラーリングと呼ぶ。RAID 1は最もシンプルなRAIDであり、耐障害性の高いRAIDである。また、RAIDの最大の弱点であるRAIDコントローラの故障にも対応しやすい。RAID 1には最低2ドライブが必要である。一台が故障した際に、もう一方も同時に故障する可能性は低く、システムは稼動し続けることが出来る。例えば、ある条件で一定期間使用した場合におけるドライブの故障率が1%だったとした場合、1台ならば故障率は1%だが、2台でRAID 1を構成した場合は0.01% (0.01*0.01=0.0001) と故障率は1/100となり、耐障害性が上がる。ただし、複数台に同じデータを持っているので、扱えるデータ容量としてはアレイを構成するハードディスク容量の半分以下となる。RAID 1ではハードディスク台数が増えれば増えるほどハードディスクの利用効率が悪くなる。ハードディスクの利用効率を重要視するならばRAID 5の方がよい。また、RAID 1をRAIDコントローラひとつで構成した場合、そのRAIDコントローラが故障してしまうと、ハードディスクが健在であってもドライブのアクセスが不能となる。特に信頼性を重視する場合には、ハードディスクひとつにRAIDコントローラひとつを割り当てて使用する。本来RAID 1の読み出しは、一つのドライブのみにアクセスし、もう片方は、完全なバックアップドライブである。これを双方から読み出すようアルゴリズムを拡張することで、理論上、単体ディスクの2倍の速度で読み出しを行える。初期のネットワークOSであるNetware 2.x、3.xでは、RAID 1であっても積極的に書き込み・読み出し速度向上を行うアルゴリズムを取り入れており、コントローラが複数個ある場合には一方のディスクに書き込みながら他方のディスクから読み込みを行うなどの負荷分散を積極的に行っていた。従って、複数のディスク間で記録されているデータに不一致が発生する時間があり、ディスクの同期化を完了させてから終了する必要があった。しかし、常に性能を重視した実装が行われている訳ではなく、Windows NTに実装されているソフトウェアRAID 1では読み込み、書き込み共にひとつで、読み込みは常に一方のディスクからのみ行われる。Windows Server 2003は低負荷時には片方から、高負荷時には負荷分散を行う。RAID 0とRAID 1を組み合わせた構成を特別にRAID 0+1 (RAID 01) およびRAID 1+0 (RAID 10) と呼ぶ。高速化、大容量化を目指したRAID 0と高信頼性を求めたRAID 1を組み合わせることにより、速度、容量、耐障害性の向上を図ることができる。最低4ドライブ必要である。RAID 0とRAID 1は相性がよく、RAID 1の特性によりRAID 0の弱点であったランダムアクセスも高速化できる。RAID 1を使用しているためコントローラの2重化にも対応できるので、容量が必要でなおかつ強力な耐障害性を求める場合に採用されることが多い。RAID 0とRAID 1、どちらを下層で行うかにより名前が変わる。0または1は、下層で行われる処理を先に表記する。一見どちらも同じように見えるが耐障害性の面で異なる。ドライブ故障への耐性はRAID 1+0のほうが優れている。RAID 0+1ではRAID 1を構成するRAID 0領域のドライブそれぞれ1台ずつが故障した時点でデータが破壊されるが、RAID 1+0ではRAID 0を構成するRAID 1セットの構成ドライブ2台がどちらも故障しない限りデータは破壊されない。台数が増えれば増えるほどRAID 1+0のほうが耐障害性が上がる。コントローラ故障への耐性はRAID 0+1が上回る局面も存在しうるが、基本的にはRAID 1+0のほうが優れていると考えてよい。RAID 2の冗長化機構はハミング符号で、ストライプ単位は1ビットである。ハミングコードによるデータ修復が常に必要なほどHDDの信頼性は低くないので、RAID 2は実用性がなく、製品は市販されていない。RAID 2の耐障害性、実装に必要なドライブ数は、訂正可能ビット数により異なるため一意に記述できない。最低で5ドライブを必要とする。RAID 3はRAID 2の誤り訂正符号を排他的論理和によるパリティに変更し、演算コストを低減したものである。最低3ドライブで構成され、1台を誤り訂正符号に割り当て、残りの複数台にデータを記録する。ビデオ編集機器においてはアクセスの殆どがシーケンシャルアクセスであることから、現在でもRAID 3が用いられている場合があるが、パソコンやサーバでRAID 3を用いるメリットは存在しない。RAID 4はRAID 3のI/O単位をブロックに拡大し、I/O効率の改善を図ったものである。最低3台で構成される。以下の短所からRAID5へ移行され、RAID4は実質的に消滅している。RAID 5は水平パリティを使用して複数のハードディスクに誤り訂正符号データと共に分散させて記録することで、RAID 3、RAID 4のボトルネックを回避している。最低3ドライブが必要である。RAID1やRAID1+0に比べて使用効率に優れている。またRAID0のように複数のディスクに分散しているため読み出し性能が優れている。一方で書き込む場合にはパリティブロックを作成しなおすために、ディスクからの既存パリティ読み出しとパリティ演算が伴うが、I/Oプロセッサを搭載した高価格帯製品ではパリティを大容量キャッシュに保存しパリティ演算をI/Oプロセッサや専用演算機にて行う事で速度低下を回避している。RAID 5においてパリティはパリティ用領域に使用されるディスク以外のXORで水平方向のパリティ (PH) をとる。水平パリティはそれぞれのディスクに格納され、1台のディスク障害に耐えることができる。ディスク障害時は障害の発生したディスクのXORによる再計算で復元が可能である。データ書き込み時におけるパリティ計算方法の一例を下記に掲載する（An、BnはA1 B1 A2 B2 A3 B3の順に並んだデータブロック）。A1/B1/PH1/A2/PH2/B2/PH3/A3/B3/PH1=A1+B1PH2=A2+B2PH3=A3+B3RAID 5に速度面、耐障害性などでの不満がある場合、RAID 0+1や1+0と同様に、他のRAIDと組み合わせることで弱点をカバーできる。RAID 5の速度を向上させたい場合、使っている台数と同数のハードディスクを追加してRAID 0と組み合わせるか、サーバを増設し負荷を分散させるのが有効である。RAID 5+0およびRAID 0+5を構成する場合は、最低6ドライブが必要である。RAID 1+0や0+1と同様、RAID 5とRAID 0のどちらを先に行うかで名前が変わる。RAID 5のセットによるストライピングを行うRAID 5+0のほうが、次の理由で優れているといえる。RAID 6を上回る強力な耐障害性が要求される場合、この組み合わせが選択肢となる。RAID 5+0やRAID 0+5と同様、最低6ドライブを必要とする。RAID 5+1、RAID 1+5とも3ドライブまでの同時故障に耐えられるが、RAID 1+5のほうがより強い耐障害性を持つ。メンテナンス性にも優れる。何らかの理由によりすべてのドライブを交換する必要が生じた場合、ミラーの片方のディスクを一度に交換し、リビルド後に残りを交換して再リビルド、という簡便な手順で、装置を止めることなく交換を完了でき、またこの作業中もRAID 5の耐障害性が残っている。RAID 5によってRAID 5を組む、RAID 5+5も考えられる。この構成には最低9ドライブを要する。RAID 5+1や1+5と同様、同時に3ドライブまでの故障に耐えられ、またディスク利用効率でそれらを上回る。耐障害性ではRAID 5+1と1+5の中間程度になる。同様に、3次元化したRAID 5+5+5、4次元化したRAID 5+5+5+5なども考えられる。RAID 5+5+5は7台、RAID 5+5+5+5は15台までの同時故障に耐えられるが、必要となるドライブ数およびディスク効率の面から実用的ではない。RAID 6は任意の2つのハードディスクに障害が発生してもデータが復元できるRAIDである。冗長データを2種類作成し2つのディスクに記録することで、2重障害に対応でき、同時に2ドライブが故障しても復元できる。最低4ドライブを必要とする。1つの冗長データはRAID5と同じようにパリティ符号を用いる。もう1つの冗長データは、異なるアドレスのデータからパリティを生成する方式（対角線パリティ）や、異なる係数を乗算してから生成する方式（P+Qパリティ）など、複数の実装形態がある。RAID 1のミラーリングを3重化した場合も2つのハードディスク障害に対応できるが、これは通常RAID 6とは呼ばない。EMC CLARiX/CLARiiON のRAID6では EVENODDアルゴリズムを使って、X86プロセッサのXOR命令でパリティの計算、データのリカバリをソフトウェアで行っている。大規模なシステムでは、RAID 6を用いた多重RAIDも、RAID 5と同様に考えられる。RAID 6ではRAID 5の水平パリティ (PH) に加え、対角線パリティ (PD) もパリティとして使用される。水平パリティとは異なり対角線パリティは専用のディスクに格納される。ディスク4台でRAID6を構成しているとき、対角線パリティの配置と計算は以下の通り。PH1/B1 /C1 /PD1A2 /PH2/C2 /PD2A3 /B3 /PH3/PD3PD1=PH1+C2+B3PD2=B1+A2+PH3PD3=C1+PH2+A3PパリティはRAID5と同じXORによるパリティであり、もう一つの冗長データであるQパリティは重みつきのガロア体GF(2) における剰余、つまり8ビットのCRCを用いる。8ビットCRCの制限により、この方式を用いる限りデータディスクは255台（+冗長ディスク2台）までしかサポートできない。規格のようなものがないため、生成多項式や重みのつけかたが各社で異なる。また高速化やハードウェア的な最適化のためにあらかじめ定数をかけたテーブルが用意されているなど、単純なCRCには見えない場合もある。あるいは、これ以外の算出方法を採っている場合も有り得る。具体的な算出方法は以下の通りである。データディスクをA・B・C・Dとし、冗長ディスクをP・Qとする。現実には冗長ディスクは分散されているが、便宜上こうしておく。ここで、AとはデータディスクAにある1バイトのデータであり、以下B・C・D・P・Qそれぞれ、対応する同じ位置にある1バイトのデータを示す。またCRC(x) は、値xをビット列とした時のCRC符号である。このCRCは、生成多項式が既約性を持つ（==原始多項式である）必要がある。また上記加算 (+) 及び乗算 (*) は、共にガロア体での加算乗算である。また回復方法は以下の通りである。例えばB・Dが破損したとする。となるので、この連立方程式を解く。これを代入してここで、CRCの生成多項式は原始多項式であるので、10と互いに素である。ここから中国の剰余定理を利用してBを算出する。つまり左辺を10（二進法で1010）で割る。それをに代入して D を求める。RAID ZはRAID 5やRAID 6と似た機構を持つが、ストライプ幅を可変とすることで速度と耐障害性を向上させたものである。Oracle社のSolarisやFreeBSDにおいて、ZFSとしてRAID Z1,Z2,Z3が実用化されている。RAID 5やRAID 6ではパリティ更新時に何らかの障害が発生するとデータとパリティが一致しなくなり、システム上では正常に見えても内部ではデータ破壊が進んでいるという状態（サイレントクラッシュ）に陥るという致命的な欠点がある。またストライプ幅より小さいデータを書き込む際にも、全体のデータとパリティを読み込んで再計算をする必要があるため、パフォーマンスが著しく低下するという弱点も持っている。RAID Zでは常にストライプ全体への書き込みを行い、コピーオンライトと組み合わせることでRAID 5やRAID 6が持つサイレントクラッシュの問題を完全に回避できる。無効ディスクドライブ (DDD、Defunct Disk Drive) とは、RAIDを構成するディスクにおいて何らかの障害が発生し、RAIDの構成ディスクから外されたディスクないしその状態を示す。予備ディスクドライブ (Spare Disk Drive) （予備ディスク）は、RAIDの構成で普段は使用されていないが、使用中のいずれかのディスクに障害が発生した時にそのディスクを置き換えることに備えて接続されているハードディスク装置である。たとえば、全部で4台のディスクのうち3台でRAID 5を構成するシステムを考える。RAID 5中のいずれか一台のディスクが故障すると、予備ディスクで故障ディスクを自動的に置き換えて元通りRAID 5を構成する。これら4台のディスクでRAID 6を構成しても同じ実効ディスク容量が得られるが、それと比較して予備ディスクは以下の利点・欠点をもっている。また、4台のディスクのうち3台でRAID 1を構成すると、上記のリシンク中の冗長性欠如のリスクは大幅に低減する。RAID中に組み込まれたディスクはリアルタイム・オンラインで冗長性を作り出しているのに対して、予備ディスクは実際の故障発生時にオフラインでバッチ的にまとめて冗長性を作り出していると見ることもできる。一般的に複数のディスクを構成する際にはRAIDが使用されるが、RAIDを使用しないディスク構成も存在する。

出典:wikipedia

RAID

関連ワード