listeny こと 新村と申します。
ここ2週間くらいの障害が何とか収束した様なのですが、原因に自信が無く、 既知なのか、ご存知であればお教えください。
※少々長文になりますので、自分の出した結論を先に。
「10.0 OSS の ext3 ファイルシステムは、一部の環境ではバグがあるのか?」
以下、顛末です。
当初、AthlonXP+Redhat9 で24時間運転していたマシンが、ちょこちょこと エラー(DBのページ異常やカーネルパニック)を出したり再起動がかかったり したため、OSの入れ替えを行いました。当初はfedora4 をアップデートイン ストールしましたが、セットアップがハングするので、他のマシンで使って 馴染んでいたSuSE OSS 10.0 を新規にインストールしました。
この時点で、CPU: AthlonXP 1800+ , M/B: Aopen MK77 mark2, MEM: 1.0GB HDD: ATA133 40GB x 2 (RAID1), FS: ext3 という環境だった物を、RAIDを 解除して片方に入れました。(データをあとでコピーする予定で)
このインストール後から、ext3 パーティションが、勝手にエラークラスタ を作るようになり、2日目くらいにはルートパーティションを滅茶苦茶にし てしまいました。
M/Bかメモリに異常があるのかと思い、Athlon64 + ASUS 系マザーを調達 し、HDDもSATA に変えてみました。
#組みあがったマシンに、OSS 10.0 (今度は64ビット版になりますね)を #入れたところ、nForce チップセットでは、USB が反応しなくなったり、オン #ボードのNICがパケットを送らなかったり…という症状が出ました。これに #関しては、それ以上追求せず、VIA K8T890チップセットの物を買い足し、 #そちらで動かす事が出来ました。
ずっとext3 を使いつづけていたので、今回も全てのパーティションを ext3にしていたのですが、インストール直後からfreeblock カウントが違う というエラーが発見され、ルートパーティションが滅茶苦茶になりました。 /var を別パーティションにしていますが、こちらにもエラーが起こります。 /home は比較的平穏でした。
海外サイトを含め、 linux amd64 ext3 filesystem といったキーワードで 検索してみたのですが、これといって似た事例は見つけられず、一度だけ kernel を2.6.14.2 に上げてみました(ソースからビルド)が症状は変わりま せんでした。 #2.6.14のchangelog には、ext3 filesystem のfreeblock 周りの変更があったと #載っていました。
最終的に、raiserfs(3.6)でパーティションをフォーマットし直し、ここ 24時間はエラーは発見されていない様ですので、これでうまく行くのかと 思っています。
2.6.13 カーネルのext3 にバグがあったということなのでしょうか・・・ 他のマシン(AthlonXP 2500+ と、nForce chipsetのベアボーン)では、 ext3でも特に問題は出ていません。
−−−−−
ちなみに、 sk98lin ドライバを使用した、Marvell のオンボードNICは、電源ON時には 起動しているようですが、ドライバを読み込んだ直後、ケーブルに電圧がかか ら無くなります・・・ifconfig では UPしているようですが、コネクタ部と HUBのLinkランプが消えてしまいます。
これは、これから調査です。