July 05, 2006
以前、「ファイルサーバ環境構築の巻」というエントリで、Adaptecの1420SAというRAIDカードのことを書きましたが、MacBookが新品交換でアップルとすったもんだしている陰で、実は、このRAIDカードに起因するトラブルにも悩まされていました。
現象はミラーリングという設定で同じデータを書き込んでいる二台のHDDのうち、一台が壊れた(degrade)という表示が出てしまうこと。
二台のHDDが壊れるとデータが消滅してしまうことから、非常に焦る状態になるわけです。
でもOSを一旦リブートして、RAIDカードのメニューからRAIDの再構築をすると何事もなかったのように復活してしまうのです。
そしてしばらく使っていると、また、いつしかdegradeになってしまう。別マシンのデータを自動でバックアップしているのですが、大量のファイルをスキャンするので、そこで過負荷になっているのでしょうか。でも、それぐらいで壊れてしまっては困ります。
わけがわかりません。
描いたイメージとしてはHDDが悪いのではなくて、データを書き込むRAIDカードがHDDに書き込むデータを壊しているのではないか?と思いました。データ化けのような状態になって、一台を壊してしまう。タイミングの問題なので、どちらのポートやドライブが必ず壊れるというわけではないという仮定をしました。
この現象を把握し、解決するために以下のことを行いました。
なおハード構成は、本体がHPのML110、RAIDカードがAdaptecの1210SA + 1420SAの二枚刺しで、それぞれのカードにHDDが二台ずつぶらさがっています。
1.HDDを不良品扱いで返品し、新品に交換した。
・・・しかし交換したドライブではないドライブも構わずdegradeしてしまったのと、以前から使っていた別メーカーのドライブもdegradeしてしまって激しく焦ったことから、HDDの問題ではないと判断。
2.RAIDカードそのものの交換
・・・カード交換後に結局、再発したので、個体トラブルではなさそうなことを確認。
ぷらっとホームさんご迷惑おかけいたしました。でも、自社のサポセンを持っているぷらっとホームさんで買って良かったです。
3.問題はRAIDカードの二枚刺しかもしれないと疑って、一台のRAIDカードからHDDを外して評価
・・・以前は、最悪1日でdegradeしていたのが、一ヶ月ぐらいはもちました。でも昨日degradeしました。
ということで、前から使っていた1210SAにメインのHDDをつなげて動かし始めました。1420SAはまだマシンに刺さったままですが、HDDは繋げていません。
このままでは、新しく買った1420SAは怖くて使えないです。
残る問題の候補は、
1.そもそもRAIDカードの二枚刺しなどしてはいけない。
2.サーバ機であるHPのML110のPCI-Xスロット周りが怪しい。
3.1420SAとML110の相性が悪い。
4.OS、ドライバが悪い。(ML110のBIOSも含め、最新にはしています。)
などの複合要因が考えられますが、あとは対症療法的につぶしていくしかないのかなぁ。
gigazineならここで解決しているわけですが、すいませんが未解決です。
誰かアドバイスください。