[opensuse-ja] OpenSUSE 11.1 kernel-2.6.27-7.x の inotify bug でフリーズ
山口と申します。 久々に投稿します。 私は、SUSE 8.2 (2003年くらい) から使っています。 といっても主にサーバ用途で、デスクトップ機能はほとんど使っていません。 自宅サーバでのメイン OS はずっと SuSE → OpenSUSE と使ってきました。 会社の業務用途では、残念ながら RedHat/CentOS パッケージの方が主流なので すが、かゆいところに手が届いていたり、先進的な機能を取り入れる割には Fedora よりは安定志向側に振っているように思えて気に入っています。 先日、やっと OpenSUSE 11.1 に取り組むことができ、自宅サーバのメイン OS を OpenSUSE 10.3 からグレードアップしました。自宅サーバでは以下のような サービスを運用しています。 ・内部 DNS/DHCP ・公開用 Web (日記/blog/wiki 等) ・メール (Postfix/Dovecot/Spamassassin) こちらの ML では話題になっていないようなのですが、OpenSUSE 11.1 の現在の デフォルトカーネル (2.6.27-7.x) には不具合があります。 [inotify bug] ・inotify という kernel の機能を使用すると、不定期にカーネルごとフリーズ する。 ・inotify は最近の dovecot (IMAP) や samba が利用している。 自宅サーバを OpenSUSE 11.1 にグレードアップしたところ、1日に数回 OS の 応答がなくなる現象が出始め、2週間ほど悩みました。 ・停止する際にはログ (syslog/dmesg) は全く出ない ・panic 表示もない ・ただし ping だけは応答がある場合がある 当初は OpenSUSE 11.1 (x86_64) だったため、32bit 版を新規にインストールし なおしたりして検証を進めたのですが、まったく同様の現象が出て相当困りまし た。一時は 11.0 か 10.3 に戻すことを真剣に考えました。 先日、ようやく解決にたどり着きましたので報告しておきます。 [OpenSUSE Forum] 11.1 systems locking up? (2008/12/30) http://forums.opensuse.org/install-boot-login/403483-11-1-systems-locking-up... 3台インストールした 11.1 のうち2台が lock up してしまうと報告されてい ます。 続くスレッドで、Bugzilla の方へのリンクがありました。 Bug 463372 - Kernel 2.6.27.7 SuSE file monitoring serious bug (inotify) https://bugzilla.novell.com/show_bug.cgi?id=463372 ・kernel 2.6.27.7 で Dovecot の IMAP サービスにより inotify bug による 停止できない暴走プロセスが引き起こされる ・kernel 2.6.27.10 以降の最新バージョンでは fix されている ということなのですが、yast update レポジトリには、未だに 2.7.27.10 以降 は公開されていないようで、結局 FACTORY レポジトリから以下のパッケージを ダウンロードして Update しました。 http://download.opensuse.org/factory/repo/oss/ 関連パッケージとしては以下の通りです。 (i586) kernel-pae kernel-pae-base kernel-pae-extra vmware-kmp-pae (※ VMware 上にインストールしている場合) (x86_64) kernel-default kernel-default-base kernel-default-extra vmware-kmp-default (※ VMware 上にインストールしている場合) 結果、11.1 の i586 および x86_64 版で生じていた1日数回のフリーズが収ま り、現在は安定しています。 kernel だけ FACTORY 版に差し替えて問題ないのか不安ではあるのですが、状況 としてはこうしないと安定稼働してくれないため、暫定措置として実施しています。 なお、Dovecot(IMAP) を使っていない方のサーバは 2.6.27-7 でも問題は発生し ていません。 以上、なんらかの参考になればと思い、報告しておきます。 ■参考 INOTIFY Section: Linux Programmer's Manual (7) Updated: 2008-11-18 http://www.linux.or.jp/JM/html/LDP_man-pages/man7/inotify.7.html -- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 松本です。 問題発生から一応の解決を見るまでのサマリを簡潔にまとめてお知らせいただ き、ありがとうございます。分かり易く、手がかりを得るまでの経緯まで教えて いただけていて、非常に助かります。 山口健史 さんは書きました:
[inotify bug] ・inotify という kernel の機能を使用すると、不定期にカーネルごとフリーズ する。 ・inotify は最近の dovecot (IMAP) や samba が利用している。
samba を動かしている仕事場のサーバを 11.0 から 11.1 に上げようかどうか考 えていたところだったので、知っていると知らないとでは大違いです。助かります。
kernel だけ FACTORY 版に差し替えて問題ないのか不安ではあるのですが、状況 としてはこうしないと安定稼働してくれないため、暫定措置として実施しています。
Bugzilla の方でも触れられているように、当然ながら kernel 依存のドライバ やモジュールについては入れ替えてやる必要があるとは思いますが、現状でその へんの問題が発生していないようなら大丈夫ではなかろうかと。 # 軽はずみなことを言ってしまうのもまずいかな? # でも、サーバ用途で使っているということであれば # むやみやたらと余計なパッケージを突っ込んでたりはしませんよね? それにしても、2.6.27-7 についていくつか問題が報告されている割に、なかな か FIX された kernel が updates に上がってきませんね。
以上、なんらかの参考になればと思い、報告しておきます。
参考になります。重ねて、どうもありがとうございました。 - -- _/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/ _/_/ Satoru Matsumoto - openSUSE Member - Japan _/_/ _/_/ Marketing & Weekly News Team _/_/ _/_/ mail: helios_reds@gmx.net / irc: HeliosReds _/_/ _/_/ http://blog.geeko.jp/author/heliosreds _/_/ _/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/ -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.9 (GNU/Linux) Comment: Using GnuPG with SUSE - http://enigmail.mozdev.org iEYEARECAAYFAkmVqgIACgkQXnHIfHE6+z2jcgCeJfzOQKDPj90udWNZlNkKOGpu gqQAniogOQG6RR6JV6tcX/6nOyX0wHfg =RiGy -----END PGP SIGNATURE----- -- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
山口です。 # いやー Thunderbird の Reply to List アドオン便利ですねー。早速使ってます。 Satoru Matsumoto さんは書きました:
Bugzilla の方でも触れられているように、当然ながら kernel 依存のドライバ やモジュールについては入れ替えてやる必要があるとは思いますが、現状でその へんの問題が発生していないようなら大丈夫ではなかろうかと。 # 軽はずみなことを言ってしまうのもまずいかな? # でも、サーバ用途で使っているということであれば # むやみやたらと余計なパッケージを突っ込んでたりはしませんよね?
実は 自宅サーバは最近 VMware ESXi 化して、その上に VM として OpenSUSE を 2つ(i586版と x86_64版) 入れています。そのため、インストール時に極力 パッケージを削っていますが、一部自前 rpm を追加で入れています。 # 日本語パッチを当てた Squirrelmail 等 検証時に Dovecot/Postfix だけをいれた VM だけが CPU使用率 100% になる (VI client で確認) ので、VMware との相性、open-vm-tools等を疑ったのです が、kernel 側の問題だとは思いませんでした。
それにしても、2.6.27-7 についていくつか問題が報告されている割に、なかな か FIX された kernel が updates に上がってきませんね。
同じ問題で悩んでいる人がいると思うので、極力早く公式 kernel がアップデー トされるといいですね。 -- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 松本です。 以下、オフトピックとして。 山口健史 さんは書きました:
それにしても、2.6.27-7 についていくつか問題が報告されている割に、なかな か FIX された kernel が updates に上がってきませんね。
同じ問題で悩んでいる人がいると思うので、極力早く公式 kernel がアップデー トされるといいですね。
updates だけじゃなく、Factory の kernel も全然バージョンが上がっていかな いということが -factory ML で指摘されたんですが、「kernel-of-the-day の 方にあるのはもう 2.6.29-rc5 まで上がっているんだけど、本来なら Factory に置かれるべきそれがまだ置かれていない。何故なのか、Jeff ならもしかした ら知っているかも…」ということらしいです。って、Jeff って誰?(笑) あくまで個人的な「なんとなく」なんですが、SLE 11 のリリースに向けて人的 リソースがそちらに回ってしまっており、後手後手になってしまっているような…。 - -- _/_/ Satoru Matsumoto - openSUSE Member - Japan _/_/ _/_/ Marketing/Weekly News/openFATE Screening Team _/_/ _/_/ mail: helios_reds_at_gmx.net / irc: HeliosReds _/_/ _/_/ http://blog.geeko.jp/author/heliosreds _/_/ -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.9 (GNU/Linux) Comment: Using GnuPG with SUSE - http://enigmail.mozdev.org iEYEARECAAYFAkmY41EACgkQXnHIfHE6+z0T+wCgjyl8pvH5f/A2rt7peP7KyJ+z wHcAmwTq58ikOPVH8sDi55sAqH9lyacK =xLcx -----END PGP SIGNATURE----- -- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
At Mon, 16 Feb 2009 12:53:53 +0900, Satoru Matsumoto wrote:
松本です。
以下、オフトピックとして。
山口健史 さんは書きました:
それにしても、2.6.27-7 についていくつか問題が報告されている割に、なかな か FIX された kernel が updates に上がってきませんね。
同じ問題で悩んでいる人がいると思うので、極力早く公式 kernel がアップデー トされるといいですね。
updates だけじゃなく、Factory の kernel も全然バージョンが上がっていかな いということが -factory ML で指摘されたんですが、「kernel-of-the-day の 方にあるのはもう 2.6.29-rc5 まで上がっているんだけど、本来なら Factory に置かれるべきそれがまだ置かれていない。何故なのか、Jeff ならもしかした ら知っているかも…」ということらしいです。って、Jeff って誰?(笑)
Jeff Mahoney の事で、現在カーネルのリリースマネージメントをしています。
あくまで個人的な「なんとなく」なんですが、SLE 11 のリリースに向けて人的 リソースがそちらに回ってしまっており、後手後手になってしまっているような…。
手短に言えば、そういうことですね。 もう少し具体的に言うと、SUSE の内部で管理されているカーネルツリーがあ るのですが、KOTD はこのツリーから直接ビルドされます。ですから、その時々 でたまに壊れたりする訳です。 FACTORY またはリリースのカーネルは、適当な時を見計らってこのカーネルツ リーからチェックインされます。現在 SLE11 のテストがまだ進んでいる状況 なので、FACTORY のカーネルチェックインは、まあちょっと置き去りにされて いる、という具合な訳です。FACTORY に上げて、突然 regression report が 多数舞い込むと手が回らないので…。 -- Takashi Iwai <tiwai@suse.de> -- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
山口です。 openSUSE 11.1 の kernel 2.6.27.7 で inotify bug により dovecot 等でカー ネルがフリーズしてしまう、という話題ですが、昨日 YaST update を実施した ところ、 kernel 2.6.27.19-3.2.1 まで一気にバージョンが上がりました。まだ半日ほどしか経過していませんがい まのところ 32bit 版および 64bit 版共に安定稼働しています。 以前のメールで 2.6.27-7 という表記をしてしまいましたが、2.6.27.7 や 2.6.27.19 という表記が正確なのですね。失礼しました。 ■参考 (1) [security-announce] SUSE Security Announcement: Linux kernel (SUSE-SA:2009:010) * From: Marcus Meissner <meissner@xxxxxxx> * Date: Thu, 26 Feb 2009 17:06:24 +0100 http://lists.opensuse.org/opensuse-security-announce/2009-02/msg00003.html (2) Linux kernel ML 関連 Date Fri, 20 Feb 2009 17:53:05 -0800 (PST) From Linus Torvalds <> Subject Re: Li-nux 2.6.27.19 2.6.28.7 http://lkml.org/lkml/2009/2/20/416 (3) Linux Kernel Watch 2008年10月版 http://www.atmarkit.co.jp/flinux/rensai/watch2008/watch10b.html ----- 2.6.27は2.6.16に代わるLTSに Adrian Bunkは2.6.27のリリースを受けて、「2.6.16もちょっと古くなってき たし、2.6.27を2.6.16の代わりの長期サポートカーネル(Long Time Supported Kernel、LTS)としてメンテしていくよ」と宣言しました。 ----- 2.6.27.19 は本家ではまだ 2/20 にリリースされたてだそうで。 素早いお仕事ありがとうございます>メンテナの皆様 Takashi Iwai さんは書きました:
At Mon, 16 Feb 2009 12:53:53 +0900, Satoru Matsumoto wrote:
松本です。
以下、オフトピックとして。
山口健史 さんは書きました:
それにしても、2.6.27-7 についていくつか問題が報告されている割に、なかな か FIX された kernel が updates に上がってきませんね。 同じ問題で悩んでいる人がいると思うので、極力早く公式 kernel がアップデー トされるといいですね。 updates だけじゃなく、Factory の kernel も全然バージョンが上がっていかな いということが -factory ML で指摘されたんですが、「kernel-of-the-day の 方にあるのはもう 2.6.29-rc5 まで上がっているんだけど、本来なら Factory に置かれるべきそれがまだ置かれていない。何故なのか、Jeff ならもしかした ら知っているかも…」ということらしいです。って、Jeff って誰?(笑)
Jeff Mahoney の事で、現在カーネルのリリースマネージメントをしています。
あくまで個人的な「なんとなく」なんですが、SLE 11 のリリースに向けて人的 リソースがそちらに回ってしまっており、後手後手になってしまっているような…。
手短に言えば、そういうことですね。
もう少し具体的に言うと、SUSE の内部で管理されているカーネルツリーがあ るのですが、KOTD はこのツリーから直接ビルドされます。ですから、その時々 でたまに壊れたりする訳です。
FACTORY またはリリースのカーネルは、適当な時を見計らってこのカーネルツ リーからチェックインされます。現在 SLE11 のテストがまだ進んでいる状況 なので、FACTORY のカーネルチェックインは、まあちょっと置き去りにされて いる、という具合な訳です。FACTORY に上げて、突然 regression report が 多数舞い込むと手が回らないので…。
-- Takashi Iwai <tiwai@suse.de>
-- To unsubscribe, e-mail: opensuse-ja+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-ja+help@opensuse.org
participants (4)
-
Satoru Matsumoto
-
Takashi Iwai
-
YAMAGUCHI Kenji
-
山口健史