
listeny こと 新村と申します。 ここ2週間くらいの障害が何とか収束した様なのですが、原因に自信が無く、 既知なのか、ご存知であればお教えください。 ※少々長文になりますので、自分の出した結論を先に。 「10.0 OSS の ext3 ファイルシステムは、一部の環境ではバグがあるのか?」 以下、顛末です。 当初、AthlonXP+Redhat9 で24時間運転していたマシンが、ちょこちょこと エラー(DBのページ異常やカーネルパニック)を出したり再起動がかかったり したため、OSの入れ替えを行いました。当初はfedora4 をアップデートイン ストールしましたが、セットアップがハングするので、他のマシンで使って 馴染んでいたSuSE OSS 10.0 を新規にインストールしました。 この時点で、CPU: AthlonXP 1800+ , M/B: Aopen MK77 mark2, MEM: 1.0GB HDD: ATA133 40GB x 2 (RAID1), FS: ext3 という環境だった物を、RAIDを 解除して片方に入れました。(データをあとでコピーする予定で) このインストール後から、ext3 パーティションが、勝手にエラークラスタ を作るようになり、2日目くらいにはルートパーティションを滅茶苦茶にし てしまいました。 M/Bかメモリに異常があるのかと思い、Athlon64 + ASUS 系マザーを調達 し、HDDもSATA に変えてみました。 #組みあがったマシンに、OSS 10.0 (今度は64ビット版になりますね)を #入れたところ、nForce チップセットでは、USB が反応しなくなったり、オン #ボードのNICがパケットを送らなかったり…という症状が出ました。これに #関しては、それ以上追求せず、VIA K8T890チップセットの物を買い足し、 #そちらで動かす事が出来ました。 ずっとext3 を使いつづけていたので、今回も全てのパーティションを ext3にしていたのですが、インストール直後からfreeblock カウントが違う というエラーが発見され、ルートパーティションが滅茶苦茶になりました。 /var を別パーティションにしていますが、こちらにもエラーが起こります。 /home は比較的平穏でした。 海外サイトを含め、 linux amd64 ext3 filesystem といったキーワードで 検索してみたのですが、これといって似た事例は見つけられず、一度だけ kernel を2.6.14.2 に上げてみました(ソースからビルド)が症状は変わりま せんでした。 #2.6.14のchangelog には、ext3 filesystem のfreeblock 周りの変更があったと #載っていました。 最終的に、raiserfs(3.6)でパーティションをフォーマットし直し、ここ 24時間はエラーは発見されていない様ですので、これでうまく行くのかと 思っています。 2.6.13 カーネルのext3 にバグがあったということなのでしょうか・・・ 他のマシン(AthlonXP 2500+ と、nForce chipsetのベアボーン)では、 ext3でも特に問題は出ていません。 −−−−− ちなみに、 sk98lin ドライバを使用した、Marvell のオンボードNICは、電源ON時には 起動しているようですが、ドライバを読み込んだ直後、ケーブルに電圧がかか ら無くなります・・・ifconfig では UPしているようですが、コネクタ部と HUBのLinkランプが消えてしまいます。 これは、これから調査です。

今井です。 Thursday 24 November 2005 14:54、Listeny さんは書きました:
当初、AthlonXP+Redhat9 で24時間運転していたマシンが、ちょこちょこと エラー(DBのページ異常やカーネルパニック)を出したり再起動がかかったり したため、OSの入れ替えを行いました。当初はfedora4 をアップデートイン ストールしましたが、セットアップがハングするので、他のマシンで使って 馴染んでいたSuSE OSS 10.0 を新規にインストールしました。
この時点で、CPU: AthlonXP 1800+ , M/B: Aopen MK77 mark2, MEM: 1.0GB HDD: ATA133 40GB x 2 (RAID1), FS: ext3 という環境だった物を、RAIDを 解除して片方に入れました。(データをあとでコピーする予定で)
このインストール後から、ext3 パーティションが、勝手にエラークラスタ を作るようになり、2日目くらいにはルートパーティションを滅茶苦茶にし てしまいました。
M/Bかメモリに異常があるのかと思い、Athlon64 + ASUS 系マザーを調達 し、HDDもSATA に変えてみました。
#組みあがったマシンに、OSS 10.0 (今度は64ビット版になりますね)を #入れたところ、nForce チップセットでは、USB が反応しなくなったり、オン #ボードのNICがパケットを送らなかったり…という症状が出ました。これに #関しては、それ以上追求せず、VIA K8T890チップセットの物を買い足し、 #そちらで動かす事が出来ました。
BIOSにバグ抱えてるのかもしれませんよ。 うちではnForce(GT)、2、3、4とnForce系のマザーばっかりになってますが、nForce3 のMSI K8N Neo2 PlatinumでBIOSに不具合抱えててSUSE標準のドライバでUSBと NIC使えない時期がありましたから。 その時はUSBは結局ダメで、NICについてはnVIDIA配布のnvnetドライバで使えました。 今は最新BIOSでUSB、NICとも10.0(OSS含む)の標準ドライバでエラーも無く使えてい ますが。
ずっとext3 を使いつづけていたので、今回も全てのパーティションを ext3にしていたのですが、インストール直後からfreeblock カウントが違う というエラーが発見され、ルートパーティションが滅茶苦茶になりました。 /var を別パーティションにしていますが、こちらにもエラーが起こります。 /home は比較的平穏でした。
こっちの方は残念ながら判りません。 私のところではXFSかReiserFSしか使わないので。 -- ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 今井 優 mail: maimai@coral.ocn.ne.jp web: http://www10.ocn.ne.jp/~masimai/ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

On Thu, 24 Nov 2005 16:48:17 +0900 Masaru Imai <maimai@coral.ocn.ne.jp> wrote:
今井です。
Thursday 24 November 2005 14:54、Listeny さんは書きました:
当初、AthlonXP+Redhat9 で24時間運転していたマシンが、ちょこちょこと エラー(DBのページ異常やカーネルパニック)を出したり再起動がかかったり したため、OSの入れ替えを行いました。当初はfedora4 をアップデートイン ストールしましたが、セットアップがハングするので、他のマシンで使って 馴染んでいたSuSE OSS 10.0 を新規にインストールしました。 中略
#組みあがったマシンに、OSS 10.0 (今度は64ビット版になりますね)を #入れたところ、nForce チップセットでは、USB が反応しなくなったり、オン #ボードのNICがパケットを送らなかったり…という症状が出ました。これに #関しては、それ以上追求せず、VIA K8T890チップセットの物を買い足し、 #そちらで動かす事が出来ました。
BIOSにバグ抱えてるのかもしれませんよ。
うちではnForce(GT)、2、3、4とnForce系のマザーばっかりになってますが、nForce3 のMSI K8N Neo2 PlatinumでBIOSに不具合抱えててSUSE標準のドライバでUSBと NIC使えない時期がありましたから。
USB・NICに関してはそれを考えました。 M/Bは、ASUSのA8N5X,GIGABYTE GA-K8N と試し、片方はUSB OKでNICダメ。もう一方 はその逆になりました。USBは我慢しても良かったのですが、KVMスイッチがUSBなので、 替えました。 本題の方: ReiserFS に変えて現在の状況は、問題無く動いています。 先ほど、Network Install 用のブートCDから起動して、全部のパーティションに reiserfsck --checkをかけた結果です。 reiserfs は初めてなのですが、マウント状態でreadonly check がかけられないのが 少々心配です。(笑)

その後 AthlonXP 2500+ & nForce3 (だったかな) 1GB MEM, 80GB ATA133HDD x 1 という環境で、ext3 を使ったマシンも、e2fsck -n でエラーがでてました。 また、DELL PowerEdge 850 (Pentium D)でも同様にエラーがでていました。 この2台では、まだ深刻なファイルエラーには至っていません。 マウント中に、e2fsck -n をかけた際に、HDDの遅延書き込み等で、エラーが 一時的に出るのかと 当初は思いましたが、それだけでは済みませんでした。 ちなみに、同時期に稼動させたDELL PowerEdge 2850 とRedhat Enterprise Linux4 AS では、ext3 を採用していますが、こちらでe2fsck -n を行っても常にclean と でます。 今日、Yast2 が、HAL のアップデートを通知してきました。Yast2に出た注釈 では、関連がありそうでしたが、本来のBUG DBを見ていないので確認まではして おりません。 とりあえず、このパッチは当てました。 reiserfs で入れなおしたマシンは問題無いようです。 ext3 を使ってる方で、e2fsck -n を行って、問題出ませんか?←これは当たり前の症状? On Thu, 24 Nov 2005 17:10:59 +0900 Listeny <listen@system-canvas.com> wrote:
On Thu, 24 Nov 2005 16:48:17 +0900 Masaru Imai <maimai@coral.ocn.ne.jp> wrote:
今井です。
Thursday 24 November 2005 14:54、Listeny さんは書きました:
当初、AthlonXP+Redhat9 で24時間運転していたマシンが、ちょこちょこと エラー(DBのページ異常やカーネルパニック)を出したり再起動がかかったり したため、OSの入れ替えを行いました。当初はfedora4 をアップデートイン ストールしましたが、セットアップがハングするので、他のマシンで使って 馴染んでいたSuSE OSS 10.0 を新規にインストールしました。 中略
#組みあがったマシンに、OSS 10.0 (今度は64ビット版になりますね)を #入れたところ、nForce チップセットでは、USB が反応しなくなったり、オン #ボードのNICがパケットを送らなかったり…という症状が出ました。これに #関しては、それ以上追求せず、VIA K8T890チップセットの物を買い足し、 #そちらで動かす事が出来ました。
BIOSにバグ抱えてるのかもしれませんよ。
うちではnForce(GT)、2、3、4とnForce系のマザーばっかりになってますが、nForce3 のMSI K8N Neo2 PlatinumでBIOSに不具合抱えててSUSE標準のドライバでUSBと NIC使えない時期がありましたから。
USB・NICに関してはそれを考えました。 M/Bは、ASUSのA8N5X,GIGABYTE GA-K8N と試し、片方はUSB OKでNICダメ。もう一方 はその逆になりました。USBは我慢しても良かったのですが、KVMスイッチがUSBなので、 替えました。
本題の方: ReiserFS に変えて現在の状況は、問題無く動いています。 先ほど、Network Install 用のブートCDから起動して、全部のパーティションに reiserfsck --checkをかけた結果です。
reiserfs は初めてなのですが、マウント状態でreadonly check がかけられないのが 少々心配です。(笑)
-- For additional commands, email: suse-linux-ja-help@suse.com

今井です。 Sunday 27 November 2005 02:25、Listeny さんは書きました:
AthlonXP 2500+ & nForce3 (だったかな) 1GB MEM, 80GB ATA133HDD x 1
nForce3チップセット?(1チップだからチップセットっていうのも....だけど)って64bit版 しか無いと思うのでnForce2チップセットでは?
という環境で、ext3 を使ったマシンも、e2fsck -n でエラーがでてました。
また、DELL PowerEdge 850 (Pentium D)でも同様にエラーがでていました。
この2台では、まだ深刻なファイルエラーには至っていません。 マウント中に、e2fsck -n をかけた際に、HDDの遅延書き込み等で、エラーが 一時的に出るのかと 当初は思いましたが、それだけでは済みませんでした。
私はマウント中のfsckそのものを信用したくないですが....。 マウント中のe2fsck -nってそもそも当てにならないと思うんですけど....。 同期書き込みで書いてカーネル等のバッファが空の状態でならまだしも非同期で 誰が書くか判らないし、書いてるかもしれない状態でfsckというのも....。 アンマウントされていれば基本的には誰も書けないはずなのでまだましだと思い ますけど...。 ハードウェアの方(メモリ、HDDの接続ケーブル等)で問題抱えてないのでしょう か....。 -- ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 今井 優 mail: maimai@coral.ocn.ne.jp web: http://www10.ocn.ne.jp/~masimai/ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

夜分にどうも
今井です。
Sunday 27 November 2005 02:25、Listeny さんは書きました:
AthlonXP 2500+ & nForce3 (だったかな) 1GB MEM, 80GB ATA133HDD x 1
nForce3チップセット?(1チップだからチップセットっていうのも....だけど)って64bit版 しか無いと思うのでnForce2チップセットでは?
という環境で、ext3 を使ったマシンも、e2fsck -n でエラーがでてました。
また、DELL PowerEdge 850 (Pentium D)でも同様にエラーがでていました。
この2台では、まだ深刻なファイルエラーには至っていません。 マウント中に、e2fsck -n をかけた際に、HDDの遅延書き込み等で、エラーが 一時的に出るのかと 当初は思いましたが、それだけでは済みませんでした。
私はマウント中のfsckそのものを信用したくないですが....。 マウント中のe2fsck -nってそもそも当てにならないと思うんですけど....。 同期書き込みで書いてカーネル等のバッファが空の状態でならまだしも非同期で 誰が書くか判らないし、書いてるかもしれない状態でfsckというのも....。
アンマウントされていれば基本的には誰も書けないはずなのでまだましだと思い ますけど...。
それはわかります。フリーブロックカウントのアンマッチ程度で済めば目くじら 立てませんが、以前のマシンは、その後アンマウントしてからfsck をかけても エラーが出て、最終的にはルートが逝っちゃったわけなんですよ。
ハードウェアの方(メモリ、HDDの接続ケーブル等)で問題抱えてないのでしょう か....。
最初のマシンはそれを疑いました。今となっては元の形をしていないので 確かめようがありませんが…。 reiserfsck --check は、マウント中のread-only チェックをしてくれませんが、 予防の意味ではチェックさせて欲しいですねぇ・・・せめてシングルユーザの 時は。 同じ目には会いたくないので、10.0 OSS + ext3 マシンはreiserに変える予定です。

今井です。 見逃してた所があるのでこちらにレスします。 Thursday 24 November 2005 17:10、Listeny さんは書きました:
On Thu, 24 Nov 2005 16:48:17 +0900
うちではnForce(GT)、2、3、4とnForce系のマザーばっかりになってますが、nForce3 のMSI K8N Neo2 PlatinumでBIOSに不具合抱えててSUSE標準のドライバでUSBと NIC使えない時期がありましたから。
USB・NICに関してはそれを考えました。 M/Bは、ASUSのA8N5X,GIGABYTE GA-K8N と試し、片方はUSB OKでNICダメ。もう一方 はその逆になりました。USBは我慢しても良かったのですが、KVMスイッチがUSBなので、 替えました。
あ、もしかしてUSBのRegacySupport ONにしてたりしません? RegacySupport OFFにしないと多分まともに使えないのだけど、そうなるとOSが起動する までキーボードとか使えないという....。 なので、基本的にはPS/2キーボード、マウス使わないと....問題多いと思います。 私も一時USBキーボード、マウス使おうとした時がありましたけど、そういう訳であきらめた ました。 それとNICの方はnvnetドライバでもダメだったという事でしょうか? まあnForceチップセット積んでても、チップセットの方のNICに関する機能使わない場合も あるので一概にnvnetドライバでとは言えない(今メインマシンで使ってるHDAMEX SLIもチ ップセットのNIC使ってないし)所ですが...。 -- ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 今井 優 mail: maimai@coral.ocn.ne.jp web: http://www10.ocn.ne.jp/~masimai/ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
participants (2)
-
Listeny
-
Masaru Imai