[opensuse-ja] 突然ネットワークに繋がらなくなる
こんばんは。柳原と申します。 ここ1ヶ月前くらいから私の家のサーバが おかしな挙動をするようになり、ちまちまと問題解決方法を 模索していたのですが、解決方法がわかりませんでした。 少し前に、某掲示板でも相談してみたのですが解答が得られず、 初歩的な原因だとしたら申し訳ないと MLで質問させていただくのを躊躇していたのですが どうにも原因が分かりません。 どなたか知恵を貸していただけないでしょうか・・・。 環境や現象は以下になります。 ----- ここから OSのバージョンはopensuse10.3(32bit)です。 WebサーバやFTPサーバを起動していて、外部に公開しているので 24時間つけっぱなしの状態になっているのですが、 たまに外部からも内部からもサーバマシンに接続できない状態になるのです。 接続できないというのは、 -LAN内・外部のマシンからこのサーバにpingが通らない -LAN内・外部のマシンからこのサーバにFTPアクセスできない -LAN内・外部のマシンからこのサーバのWebページにアクセスできない という感じです。 IPアドレスは固定でYaSTから設定しています。 そのサーバマシンのGUIから ping localhost →通る ping 192.168.x.x(自分のip) →通る ping 192.168.x.1(ルータのip) →通らない という事は確認しました。 この現象が起こる頻度なのですがバラバラで 問題発生直後に/var/log/messages を確認してみたのですが、 エラー等が見つからず問題のトリガーは分かりませんでした。 自分へのpingは通るので当たり前かもしれませんが ifconfigしたところ、ネットワークインタフェースは今までと変わらない記述でした。 この状態になると OSの再起動をするまで直りません。 この状態になったときに、 pgrep 等して、サーバデーモンの生死を確認したのですが、 FTPやapacheは生きていました。 ルータ傘下の他のマシンはインターネット側に出られる・LAN内の他のマシン同士で 通信可能なので、ルータではないような気がしております。 あとは、NICなのですが ASUS A8V-E SEというマザーのオンボードNICになります。 チップはMarvell 88E8053になります。 この場合、私は何を確認すればよいでしょうか?? 情報が足りなければ、指示いただけると幸いです。 よろしくお願いいたします。 ----- Akira Yanagihara ----- Email : ludient@gmail.com MSN Messenger : godsizer@hotmail.com -------------------- --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
xeon-koyamaです
ASUS A8V-E SEというマザーのオンボードNICになります。 チップはMarvell 88E8053になります。
同社のチップは 使っているマザーボードの ON chip の片割れに 乗っかっているのですが、使った事がないため情報提供できません。 modprobe sky2 なんですかね? 以前 RIOWORKS という会社のマザーボードで ACPI からみ で変な挙動で苦労した事があります。 IRQ の割り当てのところで、変な事になってないですか? http://www.takajun.net/pc/storyp061217.htm に、「熱暴走うんぬん」 イヤな事が書いてありました。 --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
おはようございます。柳原です。
modprobe sky2 なんですかね? はい、そうなんです。
IRQ の割り当てのところで、変な事になってないですか? cat /proc/interrupts してみたところ、
===== # cat /proc/interrupts CPU0 0: 257 IO-APIC-edge timer 1: 997 IO-APIC-edge i8042 6: 6 IO-APIC-edge floppy 7: 0 IO-APIC-edge parport0 8: 2 IO-APIC-edge rtc 9: 0 IO-APIC-fasteoi acpi 10: 0 IO-APIC-edge MPU401 UART 12: 4 IO-APIC-edge i8042 14: 0 IO-APIC-edge libata 15: 115420 IO-APIC-edge libata 21: 8332 IO-APIC-fasteoi sata_sil24 22: 207712 IO-APIC-fasteoi sata_via 23: 5538 IO-APIC-fasteoi uhci_hcd:usb1, uhci_hcd:usb2, ehci_hcd:usb3, uhci_hcd:usb4, uhci_hcd:usb5 24: 322049 IO-APIC-fasteoi eth0 25: 1369 IO-APIC-fasteoi VIA8237 NMI: 0 LOC: 5572989 ERR: 1 MIS: 0 ===== という感じになっていました。 リンク先を見てきました。 熱暴走ですか・・・ その可能性は全然考えていませんでした。 もしそうなるとNIC追加するか ヒートシンクなりで対処しないとダメそうですね・・・。 ----- Akira Yanagihara ----- Email : ludient@gmail.com Messenger : godsizer@hotmail.com -------------------- --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
今井です。 Sunday 10 February 2008 03:12:00 に Akira Yanagihara さんは書きました:
OSのバージョンはopensuse10.3(32bit)です。 WebサーバやFTPサーバを起動していて、外部に公開しているので 24時間つけっぱなしの状態になっているのですが、 たまに外部からも内部からもサーバマシンに接続できない状態になるのです。
この状態になると OSの再起動をするまで直りません。
この状態になったときに、 pgrep 等して、サーバデーモンの生死を確認したのですが、 FTPやapacheは生きていました。
ルータ傘下の他のマシンはインターネット側に出られる・LAN内の他のマシン同士で 通信可能なので、ルータではないような気がしております。 あとは、NICなのですが ASUS A8V-E SEというマザーのオンボードNICになります。 チップはMarvell 88E8053になります。
この場合、私は何を確認すればよいでしょうか?? 情報が足りなければ、指示いただけると幸いです。 よろしくお願いいたします。
ルータについてサーバーとの接続ポートが問題抱えてる場合が 有ると思うので、ルータが原因では無いと判断するのはまだ早い のではありませんか?(とは言ってもルータが原因と断言する訳で はありませんけども) (1)HUBもしくはルータの電源再投入 HUBまたはルータの接続ポートの方で問題抱えてるのかどうか (2)IRQの割り当て状況の確認 IRQが重複してたりすると不安定とか動かないという場合があるので。 (3)ifconfigコマンドの実行(送受信パケットの状況の確認他) netstat -rnの実行 まれに自分のアドレスをロストしてたり、パケットロスしてたりする 場合があるので。 (4)ルータ(HUB)の接続ポートを変えてみる (1)と同じ理由 (5)NICの接続ケーブル変えてみる 接続ケーブル自体が問題抱えてるか (6)PCI、PCI-Eスロット等に何かカード挿してたら場所を入れ替えてみる (2)と同じ理由 (5)カーネル標準のsky2それとは別にMarvell配布のsk98lin(sky2)ドライバが 有るのでそちらと入れ替えてみる カーネル標準のドライバでは未対策だが、メーカー配布のドライバの方で対策 とか施してある場合がある (6)BIOSのアップデート もしマザーボードのBIOSで新しいバージョンが出ていたら更新してみる (BIOSのアップデートに不安があるなら止めておいた方が良いですけど) (7)NICを変えてみる PCI-EもしくはPCI接続でMarvell以外のチップを積んだNICを挿してみる HUBとの相性みたいなのを疑ってみる (8)HUBを変えてみる (7)と同じ理由 とか色々やってみることはあると思います。 Web上の情報とか見ると負荷掛けると88E8053が刺さった(止まる)とか Linuxに限らずWindowsでのトラブルも見掛けますね。 (7)辺りがてっとりばやい様な気も....。 -- ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 今井 優 mail: maimai@coral.ocn.ne.jp web: http://www10.ocn.ne.jp/~masimai/ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
柳原です。 今井さん、 分かりやすい確認方法ありがとうございます。 まずは、書いていただいた順番通り
(1)HUBもしくはルータの電源再投入 HUBまたはルータの接続ポートの方で問題抱えてるのかどうか からやってみようと思い、HUBの電源再投入を行ってみました。 結果を言ってしまうと(言い方が少しおかしいですが) 接続できるようになってしまったので、 (2)以降はとりあえず試せていません。
今までの状態ですと、長くても3日以内には接続できなくなってしまっていたので この状態で少し様子見をしてみたいと思います。 もしまた同じ現象が発生するようであれば、 HUBのポートを変える等、(2)以降を確認してみたいと思います。 確認事項を挙げていただいただけでも、本当に助かりました。 ありがとうございました。 ----- Akira Yanagihara ----- Email : ludient@gmail.com Messenger : godsizer@hotmail.com -------------------- --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
xeon-koyamaです。
今までの状態ですと、長くても3日以内には接続できなくなってしまっていたので この状態で少し様子見をしてみたいと思います。 もしまた同じ現象が発生するようであれば、 HUBのポートを変える等、(2)以降を確認してみたいと思います。
以前、WEBで、 1000BASE だと JumboFrame の対応関係で、 HUB と NIC の 設定 によって 問題が出る 報告をみかけた事あります。 --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 松本です。 Akira Yanagihara さんは書きました: |> (1)HUBもしくはルータの電源再投入 |> HUBまたはルータの接続ポートの方で問題抱えてるのかどうか | からやってみようと思い、HUBの電源再投入を行ってみました。 | 結果を言ってしまうと(言い方が少しおかしいですが) | 接続できるようになってしまった この季節だと可能性は低いとは思いますが、HUB の熱暴走の可能性もあるかと思 いますので、おかしくなった時、手で触ってみて異常に熱くなっていないか確認 しておくといいかもしれません。 我が家でも昨年夏、これが原因で何度かネットワーク断が発生し、原因を特定す るまでちょっと時間がかかった記憶があります。「HUB 熱暴走」あたりで検索す るとみなさん結構遭遇していることが分かると思いますが、この症状の場合、徐 々にネットワークが死んでいくということがままありますので、現象だけ見てい るととても奇妙に感じたりします。 原因が「HUB だけ」と特定できたのかどうか結論出すのはまだ早いかもしれませ んが、HUB の再起動で問題が解消したなら原因の一つであることは間違いないで しょう。民生用の HUB だと、あまり機能的に変わりがなさそうに見えてしまい ますが、細かくスペックを見ていくと、温度、消費電力などで結構違いがあった りします。 参考: http://gigazine.net/index.php?/news/comments/20070826_switch_hub/ 我が家の場合も、HUB を入れ替えたらネットワーク断はピタリと起こらなくなり ました。 - -- □●□ _/_/_/ To be Happy! _/_/_/ □□● _/_/ Satoru Matsumoto _/_/ ●●● _/ helios_reds@gmx.net _/ -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Using GnuPG with SUSE - http://enigmail.mozdev.org iD8DBQFHrmAlXnHIfHE6+z0RAvx0AJ42uUogrSLCHqqn/c3RJDTYHMgc9ACeNUmK wtZmloON/oNrxS0ENmKQe/A= =0m1k -----END PGP SIGNATURE----- --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
今井です。 少し抜けがありますので、今後もし同じ様な症状出たとき試してみてください。 koyamaさんも書かれてますけども、 JumboFrame ともう一つ AutoNego の辺りですね。 AutoNegoをアクティブにしとくと不味い つまり10/100/1000Baseのいずれか固定にしておくと安定する場合も 考えられます。 ひょっとするとその逆の方が良い場合もありますけど。 世の中色んな製品があるので一概に言えず.... -- ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 今井 優 mail: maimai@coral.ocn.ne.jp web: http://www10.ocn.ne.jp/~masimai/ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
participants (4)
-
Akira Yanagihara
-
koyama
-
Masaru Imai
-
Satoru Matsumoto