1 名前:login:Penguin [2007/01/11(木) 12:55:58 ID:rL+q6m/Y] Linuxでも標準でソフトウェアRAIDが可能となってきました。 マターリとLinuxのRAIDやその周辺技術、設定等について情報交換しましょう スレ 1 pc5.2ch.net/test/read.cgi/linux/1013875908/ スレ 2 pc10.2ch.net/test/read.cgi/linux/1111348512/ Linux RAID 一般 ttp://linas.org/linux/raid.html ttp://www.linux.or.jp/JF/JFdocs/The-Software-RAID-HOWTO.html ttp://linas.org/linux/Software-RAID/Software-RAID.html Adaptec Japan ttp://www.adaptec.co.jp/product/raid/os_support_list.html Linux EVMS 一般 ttp://www-6.ibm.com/jp/developerworks/linux/021220/j_l-fs12.html ttp://evms.sourceforge.net/ ... あと続けてくらさい。
804 名前:login:Penguin mailto:sage [2008/02/19(火) 20:27:16 ID:YZYGs6Xx] >>794 おおなるほどw >>803 そのあたりの悩みは用途次第で結論が変わるので思ったようにすればOK。 /bootにGB単位で割り当てる必要性を感じているなら、それは必要なのであってもったいないと言うことはない。 自分が障害復旧しやすい構成がって、障害復旧を優先したければそれを採用すればよい。 少なくともネットで大雑把な質問して得られた答えが最適解になることはまず無い。
805 名前:login:Penguin mailto:sage [2008/02/19(火) 21:05:13 ID:LjOdmO1l] うちの/bootは大昔に使っていた170MBのHDDだったりする。 他はSATAのGBサイズのHDDですけど。 なんか棄てるのがもったいなくて。
806 名前:login:Penguin mailto:sage [2008/02/19(火) 21:10:18 ID:9sD2K6K5] もったいない以上に、使い続けるのが怖いよw
807 名前:login:Penguin mailto:sage [2008/02/19(火) 21:35:05 ID:+qK8q1YG] やっぱり、/bootはUSBメモリに入れ込むのが楽だよなぁ。 問題はUSBメモリからbootできる機械が少ないことだけど。
808 名前:login:Penguin mailto:sage [2008/02/19(火) 23:17:24 ID:nwrDQnND] >>806 /boot なんて別に壊れてもいいじゃん。 別のディスクを用意できてるなら。
809 名前:login:Penguin mailto:sage [2008/02/19(火) 23:33:12 ID:LjOdmO1l] >>806 いや、意外にも壊れない。 よっぽど最近のHDDの方が壊れてるよ。 kernelがupdateされるたびに/bootをtarでバックアップ取って /mnt/common(ウチのsamba公開ディレクトリ)に保存してるから もしHDDが壊れても、まだまだ170MBのHDDがあるから。。。 壊れてもHDD交換してパーティション作ってtarで復元して grubをインストールするだけだから。
810 名前:login:Penguin mailto:sage [2008/02/20(水) 00:43:24 ID:Zep3uocy] うちはデータしかRAID化してないなあ。 / や /boot や自前のデータがないfilesystemは適当バックアップだけ。 復旧に要する時間はまあそれなりに、ぐらいで考えてる。
811 名前:login:Penguin mailto:sage [2008/02/20(水) 01:48:02 ID:I7MAm7/Q] 飛んでもPXEで起動してくる構成
812 名前:login:Penguin mailto:sage [2008/02/20(水) 02:38:13 ID:GsxLLhRu] >>786 ソフトウェアRAIDで細かく使いわけしてる人は 少ないと思う。めんどくさすぎて。 起動部分をRAID1なら普通かな。 ハードウェアRAIDで可能ならそれもアリじゃね?
813 名前:login:Penguin mailto:sage [2008/02/20(水) 02:44:06 ID:GsxLLhRu] うわ沢山。リロードしてなかった。 >>812 は忘れてくれ。
814 名前:login:Penguin [2008/02/20(水) 02:48:46 ID:3eSEJw3g] >>813 いや、いいんじゃないか。 俺なんかは3wareの9650SE-4PMLでRAID10(500GB*4)してるけど、/以下すべてRAID化してる。
815 名前:login:Penguin mailto:sage [2008/02/20(水) 03:01:21 ID:YArMzvpZ] mdで/bootがRAID1、/homeと/がそれぞれRAID10してるけど、 これってなにかめんどくさいっていうデメリットあるの? 個人的には/bootのためにいろんなハード持ってくるのがややこしいんだけど。
816 名前:login:Penguin [2008/02/20(水) 08:27:58 ID:3eSEJw3g] >>815 >>mdで/bootがRAID1、/homeと/がそれぞれRAID10してるけど、 >>これってなにかめんどくさいっていうデメリットあるの? 説明するのがめんどくさい、っていうデメリット。
817 名前:login:Penguin mailto:sage [2008/02/20(水) 12:31:55 ID:a4F59jek] >>814 ハードウェアRAID使うならそれが普通だと思う。 つか、そのためのハードウェアRAID。 難しい/面倒なこと何も考える必要がないw
818 名前:login:Penguin [2008/02/21(木) 00:59:49 ID:CnMgGiXf] RAIDの耐障害性について某スレのおかげで何がなんだかわかんなくなってきた。 RAID5をHDD*4台で構築したときに、どれかひとつのHDDに致命的な故障が発生したばあい、 そのサーバは通常稼動を続けたまま、HDDを入れ替えるまで稼動させることって できるんでしょうか。 RAID1+0というやつでは、同じストライプ組のRAID0 HDDが2台同時期に壊れなければ、そのまま運用を続けることができると勉強したのですが。
819 名前:login:Penguin mailto:sage [2008/02/21(木) 01:05:27 ID:0MyyZeE8] >>818 できなければ何の為のRAID5なんだよw
820 名前:login:Penguin mailto:sage [2008/02/21(木) 01:24:24 ID:LstAdxHS] 某スレってのはどこだ
821 名前:login:Penguin [2008/02/21(木) 08:29:25 ID:CnMgGiXf] >>819 できるのですね。 その場合、RAID5の仕組みから考えると障害時の縮退運転中の ホストCPUもしくはカード上のチップの処理負荷は結構なんじゃないかなと思いました >>820 ここです IDE/SATA RAIDカードあれこれ 28枚目 pc11.2ch.net/test/read.cgi/jisaku/1198522312/933n-
822 名前:login:Penguin mailto:sage [2008/02/21(木) 10:19:15 ID:QU9gU0w5] >>821 レス番あってる?
823 名前:login:Penguin mailto:sage [2008/02/21(木) 22:56:55 ID:2FpKpxEt] >>818-819 通常稼動を続けたままできるかどうかは、RAID とは別の次元の話。 ハード / ソフトの対応が必要。 まともなサーバーなら大抵サポートしているけど、安物の NAS なんかだと 電源切らないと HDD の交換ができない奴もあるよ。 >>821 通常運用時も常にパリティの演算はやってるので、特に縮退運転中の負荷が 高いわけじゃない。
824 名前:login:Penguin mailto:sage [2008/02/22(金) 00:18:05 ID:lqV65jWf] 負荷が高いのはドライブのI/Oだよな。演算じゃなく。
825 名前:login:Penguin mailto:sage [2008/02/22(金) 00:42:49 ID:gxYR4a4l] I/Oウェイトが高くなるから、それなりに重くなる。
826 名前:login:Penguin [2008/02/22(金) 02:04:19 ID:Mw1lTqHM] パリティ演算が負荷にならないのであれば、RAID5がサーバ向けとしては最強っぽい感じがするな。 ML115を買ったばかりなんだけど、オンチップのソフトRAIDでRAID5 (HDD4台)でも 試してみよかな。
827 名前:login:Penguin mailto:sage [2008/02/22(金) 02:11:23 ID:rUW8ziB5] >>823 >通常運用時も常にパリティの演算はやってるので、 嘘だっ!
828 名前:login:Penguin mailto:sage [2008/02/22(金) 06:09:35 ID:lqV65jWf] >>826 raid5デグレード時のリスクについてはさんざんこのスレでも 語られてるので、読んで納得してからGOすべし。
829 名前:login:Penguin [2008/02/22(金) 09:24:59 ID:91jcI2i+] >>828 なるほど、サンクス やっぱり、落としたくないサーバ&障害が起きてもマシン負荷や付随リスクを抑えられるサーバにしたいので、RAID1+0にすることにします。
830 名前:login:Penguin mailto:sage [2008/02/25(月) 06:57:27 ID:D7C/M5Y7] 教えて欲しい LinuxでRAID5のファイルサーバーを構築したいのだけど インストールから障害時の復旧方法が載ったHPって無い? 探したけど、構築方法だけのページが多くて どこかお勧めがあったら教えて欲しい。
831 名前:login:Penguin mailto:sage [2008/02/25(月) 10:25:31 ID:9T281o0Y] mdadm? ならmanのページにあるよ。いちばんお勧め。 壊HDD切り離しから新HDDの追加まで載ってる。 OSインストーラ上からのRAID構築手順案内してるサイトばっか見てるのかな? 初めてなら入れるときはそれでいいと思うけど、 入れたあと必ずman片手にシェルからの復旧演習しようね。 ※データドライブのみRAIDするんなら簡単だからシェルでRAID構築したほうがいい。
832 名前:login:Penguin [2008/02/28(木) 08:11:12 ID:7NHGqqq8] HDL-GTシリーズをRAID5で運用してたけど、突然RAIDが崩壊…。データ吸い出したいけど、どうしたらよい? SATA→USBに変換するケーブル4つ買って来て全部接続して、KNOPPIXから復旧できるかな? 一つだけ接続してログを確認したけど、ログがメモリ上に吐かれる仕様みたいで、ログが追えない。なにが起きたのか把握出来ないのが痛いのだが…。
833 名前:login:Penguin mailto:sage [2008/02/28(木) 17:29:56 ID:juedGX85] なんか見覚えのある書き込み。 >>620 = >>832 ??
834 名前:login:Penguin mailto:sage [2008/02/28(木) 20:50:22 ID:7NHGqqq8] >>833 あ、いや違います。 SATAが4台つくマシンがないので、そもそもSATA→USB接続では復旧不可能なのかと思って。 でも、症状は同じみたいなので、やっぱりダメかな…。 なんだか、物理的な生涯ではなさそうなんだけど…。
835 名前:login:Penguin mailto:sage [2008/02/28(木) 21:40:45 ID:juedGX85] ベースがLinuxとはいえ、哀王がカスタマイズしている可能性があるから 下手に余計なことをせずに哀王のサポートに電話した方がいいと思うよ。
836 名前:sage [2008/02/28(木) 23:54:03 ID:AxfU3lU5] >>835 ありがとうございます。 すでにIOサポートには電話済みですが、RAIDの崩壊はまったくサポートしてくれませんでした。 データ復旧会社を紹介されて終わり。ひどい。。。 というわけで、自力でできないかと模索しております。きびしいですかねぇ…
837 名前:login:Penguin mailto:sage [2008/02/28(木) 23:55:11 ID:AxfU3lU5] sage入力欄、間違えた。。。
838 名前:login:Penguin mailto:sage [2008/02/29(金) 00:08:26 ID:Gwi7QNca] 貶す意図は全く無いが、ここでこんな質問してる状況では厳しいと予想する。 暗に、Nonスキルでお手軽一発回復できる方法教えてくださいって意味だろ? 学習意欲無い人に親切丁寧に付き合ってくれる人ここには少ないよ。 他のコミュニティを頼ってみては。
839 名前:login:Penguin mailto:sage [2008/02/29(金) 00:13:55 ID:pUCuLP0q] >>836 >>620 の時の流れを見てもあまり有用な情報が出なかったもんねえ。 あれも結局どうなったか分からないし。 いいアドバイスできなくてスマソ
840 名前:login:Penguin mailto:sage [2008/02/29(金) 01:02:48 ID:NeboVMG8] >>836 自分で書いている通り、SATA→USB 4つは試す価値があるかもね。 あと、物理的に1台分格納可能な空間が4つあれば、loopback deviceでmdadmとか。 ...できないかどうか知らないが無茶っぽいか。 助言が得られないというより、 崩壊したRAIDは基本的に救えないというオチかな。やっぱり。
841 名前:login:Penguin mailto:sage [2008/02/29(金) 03:31:32 ID:js7jhxfr] そしてまた、RAIDはあくまで可用性向上のためのものなので、 バックアップを取っておくのは必須という大前提が出てくるわけですな。
842 名前:login:Penguin mailto:sage [2008/02/29(金) 10:24:30 ID:ZfFSkAXp] RAID復旧なら、こんな記事もあるが。 ttp://www.linuxjournal.com/article/8874
843 名前:sage [2008/02/29(金) 11:52:28 ID:ej7ymfjg] 836です。 >>838 RAIDに関しては確かにNonスキルですが、Linuxは自宅でもいじってます。 至急復旧しなければいけないほどではありませんので、のんびり勉強しながらやってきます。 人柱になってもよいので、可能なことがあればやってみます! >>840 なるほど、4台分全部イメージで吸い出して、1台に乗っけてloop back デバイスってことかな? たしかに行けるかもしれませんが、全部で2T…orz >>842 ありがとうございます。いま手元にないんで、ちょっと試してみます。 とりあえず、SATA→USBケーブルが1つだけあったんで、1台ずつくっつけて mdadm --examin でRAIDパーティションを見てみたけど、意味なかったかな?
844 名前:login:Penguin mailto:sage [2008/02/29(金) 20:17:36 ID:RZopCDve] LINUXいじってんならman見てわかんない? その機種がどうとかいう問題以前にちゃんとmdadm使えないと無理。 一度アレイ作って→壊して→復旧とかやってから出直し。 とりあえず>>620 くらいやるのが普通。 それとloopbackなら最低1.5TB〜出来たら2TBの作業領域、 実ディスク使うなら(危ないけど)SATA-USBがあと3つ要る。 どっちか用意しないことには何もできん。 って、ここまで書いてから気付いたんだけど本体ハックしてtelnetで入れないかな? 持ってないから知らないけれど、telnet化出来て本体起動するんなら。
845 名前:login:Penguin mailto:sage [2008/02/29(金) 20:23:12 ID:Gwi7QNca] >>843 むう、勉強する気があるならまず全ドライブをイメージ化してどういう配列になってるか調べてみたらいい。 /var/logがあるとすこぶるわかりやすいのだが、無ければ何か大きめのtextファイルを探す。 あと、NAS側で再構築すればRAID情報は初期化できるわけで、diffしてみたりFS部分書き戻してみたり・・・ もちろん各試行はvmware等で事前に実験成功させてから。データのバックアップは完全に取ること。 まぁ一般に考えられるような様々な対処が可能なのでやってみたらいい。 そしてエラーメッセージも書かずにどうかな?とかはチラシの裏へ。
846 名前:840 mailto:sage [2008/03/01(土) 00:14:18 ID:zNKGHS78] >>843 0.5Tが4枚、1つのカーネルから論理的に見えていれば何でもいい。 1つが実HDD、1つがlocal fs上のfileへのloopback、 残りがNFS上のfileへのloopbackとかでもいい。はず。 まあでも、傷を深くしないためには2T分の複製確保からか。 人柱乙
847 名前:843 mailto:sage [2008/03/01(土) 12:08:49 ID:MTZD+9N+] みなさん、どうもです。 >>844 たしかに、もうちょっと自分でmdadmの勉強・実験は必要ですね。 もちろん、本体のTelnet化はしておりました。ただ、RAIDが崩壊してからTelnetで入れない状況に。 >>845 ドライブをイメージ化してどういう配列か調べる、というのはどういうこと? RAIDの配列がどうなってたか、という意味でしょうか? /var/log は、HDL機では /var が RAM上に切ってあり、一度電源を切った時点で消滅。。。 エラーメッセージもたぶん消滅。これがかなり痛かったです。 NAS側での再構築の方法はマニュアルに載ってあるけど、その後のdiffとかFS書き戻しってどういう意味でしょう? イメージ化した元のドライブとのdiff? >>846 了解。やっぱり、まずは複製か。とりあえず、dd で吸い出せばOK? 方法より、場所の確保の方が難しそうだorz
848 名前:login:Penguin mailto:sage [2008/03/01(土) 12:24:51 ID:V1aTYABK] それにしても、哀王HDL-GTの被害者はこれで2件目。 このスレに書き込まないで哀王の言うとおりにデータを諦めているユーザーも もっといるかもね。 結構ヤバイ製品?
849 名前:843 mailto:sage [2008/03/01(土) 15:09:46 ID:MTZD+9N+] ほんとに。。。なーんにもしてないのに、月曜日会社に来てみたら「ぴーぽーぴーぽー」ってサイレンなってた。。。 「HDD外して再起動してダメだったらデータ復旧会社へ」的な案内だった。 「こういうことはめったにないんですが」って言ってたけど、ありゃしょっちゅうだな。
850 名前:login:Penguin mailto:sage [2008/03/02(日) 00:04:58 ID:t3uOwrRE] 余りストライピングについては語られないのね..
851 名前:login:Penguin mailto:sage [2008/03/02(日) 00:10:20 ID:i5pT7HBy] RAIDじゃないから。
852 名前:login:Penguin mailto:sage [2008/03/02(日) 00:12:24 ID:090WhxWO] >>850 需要が無いからな。
853 名前:日記 mailto:sage [2008/03/02(日) 12:51:56 ID:emEwbtI/] 2.6.24.3のDebianでPMP使用中。 SiI3726上に3デバイス接続し、(sda, sdb, sdc) MDを使用してRAID5で運用中。 テストとして、このうち1デバイスをそのまま外してみました。 (当然)link down。 しばらくして/proc/mdstatは[UU_]となる。 再び同じポートに再接続。 link up。 sddで認識しました。 /proc/mdstatは[UU_]のまま。以下のコマンドでhot add。 sudo mdadm /dev/md5 --manage --add /dev/sdd1 問題なくリカバリー始まってます。 続いて以下のコマンドでremove。 sudo mdadm /dev/md5 --manage --remove /dev/sdc1 以下のメッセージ。デバイスは既に削除 mdadm: cannot find /dev/sdc1: No such file or directory でも/proc/mdstatは active raid5 sdd1[3] sda1[0] sdc1[4](F) sdb1[1] で、sdc1がFailedフラグ立ったまま、まだいます。
854 名前:login:Penguin mailto:sage [2008/03/02(日) 13:43:40 ID:hc9C85N7] 何かと思ったけどポートマルチプライヤか。 RAIDと関係ないがPMの安定性とかはどう?
855 名前:853 mailto:sage [2008/03/02(日) 15:49:23 ID:cyhXWBFJ] リビルド完了したので、--examine --scanしてみました。 sdc1にFAILEDフラグのまま 次にrebootかけてみました。 再びsda, sdb, sdcで認識。 cat /proc/mdstatしたところ、普通に上記で正常動作。 どうやらmdadmも今はuuidしか見てないんですかね・・ Sargeの頃はmdadm.confにしっかりsd*が記録されて、 認識順によっては問題が起こったりしたんだけど。 PMP周りとの相性は良さそうですね PMPの動作自体はとても安定しています。 1つのSiI3726にSATA1とSATA2のドライブが混在しても 認識に問題なし。 ただSATA1のhotplugはまだ試してません(無理だろうな)
856 名前:login:Penguin mailto:sage [2008/03/04(火) 20:13:01 ID:LTSRnmt7] お邪魔します。 RAID5のパリティ生成順について質問なのですが、 パリティ生成順の指定において 「left-symmetric / left-Asymmetric / right-a(略」という言い方と 「forward / backward 」という言い方がどう対応しているのかがわかりません。 それぞれの対応は「forword」=「left-symmetric」 という理解でOKでしょうか?
857 名前:login:Penguin mailto:sage [2008/03/04(火) 20:18:38 ID:f138xmmP] forward / backwardは何語ですか?
858 名前:login:Penguin mailto:sage [2008/03/08(土) 01:42:36 ID:aT+xoS78] RAID5で、4台のうち2台をFail にした場合、再度RAID5で起動させて復旧するにはどうしたらいい?
859 名前:login:Penguin mailto:sage [2008/03/08(土) 02:25:14 ID:i/j6Zvyv] 神に祈る or タイムマシンを購入する
860 名前:login:Penguin mailto:sage [2008/03/08(土) 02:32:49 ID:9FWYbXMd] >>830 0度アダプターの説明書に書いてある。 寒心しろ。
861 名前:login:Penguin mailto:sage [2008/03/08(土) 03:46:27 ID:081564QA] HDD4台でRAID5なんて使うなと思うのはヲレだけだろうか
862 名前:login:Penguin mailto:sage [2008/03/08(土) 10:05:13 ID:ikYk3pOb] 4台でRAID5とか別に普通の構成じゃん。
863 名前:login:Penguin mailto:sage [2008/03/08(土) 10:09:55 ID:/ZyWFvm5] HDDがいっぱいだと何かいいことあるの? 二台同時に逝ったら終了なのは何台構成でも一緒でしょ。 っていうか一杯あったら10とか50とかにしない?
864 名前:login:Penguin mailto:sage [2008/03/08(土) 10:41:27 ID:i/j6Zvyv] >>863 > HDDがいっぱいだと何かいいことあるの? 容量効率が高くなる。 (4台だと 3/4 (75%) の容量だけど、10台だと 9/10 (90%) の容量が使える。) でも、当然 HDD 故障のリスクが高くなる。 ちょっと前に 10D + 1P + 1S の構成を提案したアホSEがいて、案の定リビル ド中にもう一台こけて大騒ぎになってた。
865 名前:login:Penguin mailto:sage [2008/03/08(土) 11:38:35 ID:+bpbSTe0] >>864 へぇ 素人感覚で10台ならRAID5も(何とか)大丈夫って思ってたけど やっぱりまずいのか…
866 名前:858 mailto:sage [2008/03/08(土) 12:48:01 ID:aT+xoS78] テスト用にいろいろ試してみたけど、当然、通常の起動はしないよね。 で、RAIDを同じ構成で新規作成してみると、中のデータは残ってた。 これって普通?物理障害でなければ、同じ構成で新規作成すると中身は見えるのかな?
867 名前:login:Penguin mailto:sage [2008/03/08(土) 13:41:34 ID:Omwxt5MP] 1台壊れたらアウトってよりずっとマシ まあ気休めと言われればそれまでだけど
868 名前:login:Penguin mailto:sage [2008/03/08(土) 14:56:33 ID:+bpbSTe0] >>866 実装によるだろうけど……期待してはいけない類の動作だと思う 仮に起動できても、データが本当にそのまま残ってる(化けてない) という保証をするのはやっぱり大変なわけで
869 名前:login:Penguin mailto:sage [2008/03/08(土) 16:07:01 ID:F8QvG82q] >>867 高可用性と高完全性は全然違うよ
870 名前:login:Penguin [2008/03/08(土) 17:04:17 ID:HhRa/8NZ] やっぱRAID1+0が最強だよな
871 名前:login:Penguin mailto:sage [2008/03/08(土) 17:14:30 ID:MMP300iC] 同じ4台なら、RAID10よりRAID6の方がいい。
872 名前:login:Penguin mailto:sage [2008/03/08(土) 17:21:18 ID:RSpr94Wo] いや6はwriteペナルティがあるでしょ 5,6はキャッシュとバッテリ積んだ装置でwrite backで運用するものだと思っている
873 名前:login:Penguin mailto:sage [2008/03/08(土) 18:13:10 ID:+bpbSTe0] >>872 後学のためにkwsk頼む
874 名前:login:Penguin mailto:sage [2008/03/08(土) 18:47:50 ID:RSpr94Wo] RAID5,6で writeする場合、新データに併せてパリティも更新します write範囲がストライプ全体ならば新データのみで新パリティを生成できます しかし write範囲がストライプの一部の場合には 新パリティ生成のために diskから readする必要があります(古いデータなりパリティなり) なのでRAID5,6での write処理は、read -> 新パリティ生成 -> writeという手順を踏みます 遅いディスクI/Oの readが余計に入るのでwriteペナルティと呼びます これを解消するために高額なRAID装置だとキャッシュ(メモリ)を積んでいて ホストからキャッシュにwriteした時点で応答を返し、ホストでは writeが完了します 実際のdiskへの writeはRAID装置が暇な時非同期で行ってます これが write backです ただし write back運用するとデータがRAID装置のメモリ上にしか存在しない時間が存在します このとき停電とか起きるとデータが消えちゃいます なのでバッテリなどによってキャッシュ保護してるRAID装置もあるんですよ あとね writeに不具合があるとデータとパリティがあってないことになるんですよ この状態でディスクが故障するとデータ復元した際に不正なデータになっちゃうんですよ ちょっとRAIDをかじると5とか6は怖いなと思うわけですよ 普通はそんなこと気にしないけどね
875 名前:login:Penguin mailto:sage [2008/03/08(土) 19:15:46 ID:RSpr94Wo] でも上記の話はRAID装置だけで考えた場合であって、当然OS作る人も認識してると思う 私は詳しくないけどファイルシステムで大抵が救われているんじゃないかと思っている 詳しい方解説頼む
876 名前:login:Penguin mailto:sage [2008/03/08(土) 22:34:45 ID:i/j6Zvyv] > あとね writeに不具合があるとデータとパリティがあってないことになるんですよ > この状態でディスクが故障するとデータ復元した際に不正なデータになっちゃうんですよ Write に不具合と言うのが具体的にどんな現象かよくわからんけど、ディスクにうまく書け ないことを言ってるなら、RAID でないシステムだと HDD 故障がなくても不正なデータにな ると思うぞ。(要するに、HDD の故障と同じだ。)
877 名前:login:Penguin mailto:sage [2008/03/08(土) 23:10:14 ID:RSpr94Wo] writeに不具合ってのはディスクやバスのエラーなんかを考えていただければ でwriteに失敗した場合 write through運用ならホストが失敗を認識してリトライなりメモリ保持なりで救われます write back運用でも RAID装置が失敗したことを認識してるんでキャッシュ上にはデータを保持しとくんですよ RAID1系なら不正データの範囲は write失敗した範囲と一致してるのでリカバリが取りやすいです 一方でRAID5,6などの場合、故障HDDによっては write失敗とは異なる場所でも不正データになってしまうんですよ この点がパリティ使うRAIDの弱点ですね
878 名前:login:Penguin mailto:sage [2008/03/08(土) 23:19:58 ID:cwkxJK45] 可能性の話よりもMTBFのような数値を出してくれると ありがたいのですが。
879 名前:login:Penguin mailto:sage [2008/03/08(土) 23:29:17 ID:RSpr94Wo] FCやSCIとATAのHDDだと一桁以上違いまっせ 具体的な数値は出せませぬ
880 名前:login:Penguin mailto:sage [2008/03/08(土) 23:42:30 ID:RSpr94Wo] タイポでSCIじゃなくてSCSIね
881 名前:login:Penguin mailto:sage [2008/03/09(日) 00:38:56 ID:+CxxF4jb] >>874 勉強になります ぱっと思いつくところだと >>875 は ファイルシステムのクラスタサイズと[ストライプサイズxデータドライブ台数]が一致してれば、 クラスタサイズより大きいファイルについてはwriteペナルティは減らせそうですね。
882 名前:login:Penguin mailto:sage [2008/03/09(日) 00:45:02 ID:1EA/Vx3i] >>877 > 一方でRAID5,6などの場合、故障HDDによっては write失敗とは異なる場所 > でも不正データになってしまうんですよ > この点がパリティ使うRAIDの弱点ですね 意味わからん。 RAID だろうがなんだろうが、HDD にうまく書けないことが認識できたら、 リトライしてうまくいけばそれでOK リトライで救えなければ非 RAID 装置なら上位に報告するだろうし、RAID システムなら該当の HDDを切り離して運用を継続するだけだろ。 初期の RAID システムの不具合事例を引きずっているか、「RAID 5/6 って なんか難しいことやってるんだろうなぁ」って言うイメージで語ってるとし か思えない。
883 名前:login:Penguin mailto:sage [2008/03/09(日) 01:32:14 ID:Owod6HM6] 例えば1ストリップだけのwriteが失敗した場合、 RAID1系であれば失敗した1ストリップだけリカバリすれば良いんですよ これがRAID5,6系だとwrite失敗したストリップは当然不正データでリカバリ対象なんですが 他のディスクが縮退してた場合そこのストリップも不正データになるんですよ まぁ二重障害で救えないケースとも言えるんだけどね
884 名前:login:Penguin mailto:sage [2008/03/09(日) 01:46:17 ID:whs0OwrB] >>883 縮退してなかったらリトライだろ?
885 名前:login:Penguin mailto:sage [2008/03/09(日) 02:03:27 ID:Owod6HM6] 実装にもよるんでしょうけど縮退かどうかに関わらずリトライを試みると思うよ でリトライ中に他の範囲にreadが入ってもRAID1系なら問題無し RAID5,6系で同じストライプの他の範囲にreadが入ってそこが縮退してたら救えないよという話です
886 名前:login:Penguin mailto:sage [2008/03/09(日) 02:16:32 ID:Owod6HM6] ごめん writeリトライ中ならそのデータとパリティを保持してるんで 理論上は他のディスクが縮退していてもそこのデータは復元できます でもここまでリカバリしてくれる RAIDの実装ばかりではないでしょう ということで救えないと書きました
887 名前:login:Penguin [2008/03/09(日) 03:09:10 ID:NAmJLF0M] なんかわけわからん議論してるように見えてるが、俺は>>870 の言うとおりRAID10が最強と支持!
888 名前:login:Penguin [2008/03/09(日) 03:13:49 ID:42IbcYLo] なんかわけわからん議論してるように見えてるが、俺はRAID5+テープバックアップが最強と支持!
889 名前:login:Penguin mailto:sage [2008/03/09(日) 03:31:12 ID:0nz1PJia] >>888 RAIDはあくまで可用性向上の技術なんだから、バックアップ取るのは 当たり前のことやん…
890 名前:login:Penguin mailto:sage [2008/03/09(日) 04:30:58 ID:whs0OwrB] >>885 >>886 なるほど。 よくわかりました。。。
891 名前:login:Penguin mailto:sage [2008/03/09(日) 04:39:34 ID:Jd58I2JL] >>882 >初期の RAID システムの不具合事例を引きずっているか、 結局これじゃないの?
892 名前:login:Penguin mailto:sage [2008/03/09(日) 10:03:46 ID:qGlnqLo+] >>886 長い まとめると、一部のRAID5,6実装であらゆるRAID1より完全ではないものが存在する ということか? あらゆるRAID5,6実装に適用してるかのような表現があったことと、 RAID1の実装がどこの機器でも完璧だとする考え方は直した方がいい。
893 名前:login:Penguin mailto:sage [2008/03/09(日) 11:50:22 ID:Owod6HM6] RAID1に比べてRAID5はエラー処理が複雑なんで(当然RAID6はそれ以上) 同じRAIDの実装ならRAID5の堅牢さはRAID1と同等かそれ以下だと思って上記のように書きました 現状のRAID5,6もRAID1と同等のリカバリが実装されているならそれは私の認識不足です リカバリの程度はRAIDの実装によりピンキリだとは思いますが
894 名前:login:Penguin mailto:sage [2008/03/09(日) 12:10:15 ID:1EA/Vx3i] >>893 そんなあやふやな知識の癖に、 > この点がパリティ使うRAIDの弱点ですね なんて書くから叩かれる。 >>892 が言うように論理的な話と、実装を含めた話はちゃんと区別しとかないとね。
895 名前:login:Penguin mailto:sage [2008/03/09(日) 12:21:51 ID:Owod6HM6] しっかりした知識をお持ちでしたら 現状のRAIDがどこまでリカバリできるのか解説してくださいよ 自分の知らない実装については推定にしかならないので
896 名前:login:Penguin mailto:sage [2008/03/09(日) 12:48:37 ID:1EA/Vx3i] 逆切れ? 現状の RAID って何? 実装の話するなら、具体的な機種名とか挙げなよ。 論理的な話であれば、Write に失敗する時にはバッファにはパリティを含む正しい データがあるはずだから、Read 要求が来たらそれを返せばいいだけのこと。 RAID1 と RAID5 で何の違いもないよ。
897 名前:login:Penguin mailto:sage [2008/03/09(日) 13:33:30 ID:Owod6HM6] バッファに無い領域 read要求されてそこが縮退してたらどうするわけ?
898 名前:login:Penguin mailto:sage [2008/03/09(日) 14:07:32 ID:1EA/Vx3i] 縮退している状態で Write エラーが発生したってこと? 縮退してるにもかかわらず Write していると言うことは、縮退の元となった ディスクと今回 Write エラーが発生しているディスクは違うと言うことだよ な。 1. とにかく Write リトライを優先して、リトライ完了してから Read 要求に 答える。(リトライに失敗したら、2重障害で Read 要求と Write 要求の 両方にエラーを返す。) 2. Read の方を優先させて、通常の縮退動作 (残りのデータとパリティがもと データを作成) を実施して Read 要求に答えてから、Write リトライを実施。 2重障害が発生している時に凝ったことしてもしょうがないから 1. でいいん じゃないか。 RAID1 でも同じだろ、縮退中と言うことはもう一方のディスクは壊れてるわけ なので、バッファにない領域のデータを読もうとしたら Write リトライ中の ディスクから読むしかないんだからさ。
899 名前:858 mailto:sage [2008/03/09(日) 15:42:25 ID:jN91s3c8] >>868 やっぱりそうか。。。 2台をFailした状態からとりあえず強制的にデータを救うのはRAIDの再構築以外にはないかな? --force オプションでもあがらないよね。一時的にでもRAID情報を書き換えて、正常起動させる、なんてことは不可能?
900 名前:login:Penguin mailto:sage [2008/03/09(日) 15:49:32 ID:qGlnqLo+] あーあー >>892 に追加しよう、 自分の書き込みが自らの推測であることを毎回明記すること。それから 暗黙のうちに完璧なRAID1実装例とそうではないRAID5実装例を比較し 結果をRAID5方式そのものに当てはめないこと。 その上で複雑化した方式の抱える弱点やデメリットといった話題にしてくれ。 例えば安物ハードのRAID1、RAID5では5の方が危険性の高い実装が多そうな気がする、 といった具合で。でないと意図しない部分へのツッコミばかりになると思うよ。
901 名前:login:Penguin mailto:sage [2008/03/09(日) 16:21:54 ID:jyKfmYsF] 荒れてますね。 >>893 >>あとね writeに不具合があるとデータとパリティがあってないことになるんですよ >>この状態でディスクが故障するとデータ復元した際に不正なデータになっちゃうんですよ 当方OS屋です。RAIDの実装にはそこまで詳しくありませんが、 ジャーナリングファイルシステム上では、通常このような問題は起こりません。 なぜならば、データにはメタデータと実データの2つがあり 書き込みに不具合があった場合にはメタデータの更新を行わないから。 書き込みに不具合があった場合には「代替セクタ」に書いてからメタデータを更新します。 不具合を起こした領域には二度とアクセスしません。 不具合があってさらに「代替セクタ」への書き込み前に電源が切れた場合には、 1、再起動時にRAIDソフトが管理するファイルシステムの検査を行う 2、RAIDソフト側で一致しないメタデータと実データを補足する。 3、一致しないデータに対応する、RAIDソフトが管理する他のHDDの実データとメタデータを元に戻す。
902 名前:login:Penguin [2008/03/09(日) 17:44:23 ID:fj+FBdFH] カッコンカッコンカッコン…
903 名前:login:Penguin mailto:sage [2008/03/09(日) 19:10:02 ID:pRpyLmYY] RAID5で2台Failした場合になんとかする方法を研究するくらいなら 2台壊れたときでも大丈夫な手を用意するだけのほうが 最終的に安上がりなんじゃないの?
904 名前:login:Penguin mailto:sage [2008/03/09(日) 20:27:46 ID:tUD2p1yz] そうは言うけど、linuxのmdでsataケーブル抜けなどの理由で 複数台HDD failになった場合になんとかして復旧させる方法を 調べるのはいいことじゃないだろうか。