New subject: [suse-security] kupdated in uninterrupatable sleep after kernel update

8 Dec 2003

      Hi,

One of our SuSE 8.1 servers is experiencing problems since the security
update for the do_brk() bug. Maybe this should be forwarded to SuSE's
kernel team, but since it started after upgrading the kernel I decided to
post the report here.

Here goes:

Last saterday we had to reset the machine. Remote login over ssh was not
possible. The load was steadily climbing to over 40, according to a web
interface: http://europa.hostingxs.nl/sysinfo/

Some time before the reset the kernel oopsed, oops is attached below.

Currently the server has one process in uninterruptable sleep:

hensema@europa:~> ps -eo stat,pid,cmd | grep ^D
DW       6 [kupdated]

Therefore the load is stable at 1. The server seems to be running stable
for now.

The oops:

Dec  7 00:16:16 europa kernel: invalid operand: 0000 2.4.21-151-default #1 Fri Nov 28 03:16:17 UTC 2003
Dec  7 00:16:16 europa kernel: CPU:    0
Dec  7 00:16:16 europa kernel: EIP:    0010:[ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121586616/96]    Not tainted
Dec  7 00:16:16 europa kernel: EIP:    0010:[<c1ed3c48>]    Not tainted
Dec  7 00:16:16 europa kernel: EFLAGS: 00010282
Dec  7 00:16:16 europa kernel: eax: 00000098   ebx: c1ad5000   ecx: cb617dc4   edx: c1eef956
Dec  7 00:16:16 europa kernel: esi: c39042c0   edi: c1ad5000   ebp: 00000000   esp: cb617dc0
Dec  7 00:16:16 europa kernel: ds: 0018   es: 0018   ss: 0018
Dec  7 00:16:16 europa kernel: Process popper (pid: 17541, stackpage=cb617000)
Dec  7 00:16:16 europa kernel: Stack: c1eef956 c1ef03c0 c1eea520 cb617de0 d7fbb060 c1ec9b4f c1ad5000 c1eea520
Dec  7 00:16:16 europa kernel:        d6523de8 d7fbb060 d6523cc0 00254f2c c39042c0 0014f000 d6523cc0 c1ec9c4f
Dec  7 00:16:16 europa kernel:        cb617e38 d6523cc0 0014f000 00000000 0014f000 00000000 00000002 00000085
Dec  7 00:16:16 europa kernel: Call Trace:         [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121472682/96] (04) [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121470016/96] (04) [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121494240/96] (12)
Dec  7 00:16:16 europa kernel: Call Trace:         [<c1eef956>] (04) [<c1ef03c0>] (04) [<c1eea520>] (12)
Dec  7 00:16:16 europa kernel:   [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121627825/96] (08) [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121494240/96] (32) [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121627569/96] (52) [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121522088/96] (120
)
Dec  7 00:16:16 europa kernel:   [<c1ec9b4f>] (08) [<c1eea520>] (32) [<c1ec9c4f>] (52) [<c1ee3858>] (120)
Dec  7 00:16:16 europa kernel:   [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121618842/96] (88) [generic_file_write_nolock+495/1024] (80) [generic_file_write+287/320](44) [ide-cd:__insmod_ide-cd_O/lib/modules/2.4.21-151-default/kernel/dri+-121614846/96] (32)
Dec  7 00:16:16 europa kernel:   [<c1ecbe66>] (88) [<c013773f>] (80) [<c0137bdf>] (44) [<c1ecce02>] (32)
Dec  7 00:16:16 europa kernel:   [sys_write+133/256] (36) [system_call+51/64] (60)
Dec  7 00:16:16 europa kernel:   [<c01463f5>] (36) [<c0109073>] (60)
Dec  7 00:16:16 europa kernel: Modules: [(reiserfs:<c1ec0060>:<c1ef1d74>)]
Dec  7 00:16:16 europa kernel: Code: 0f 0b 4e 01 5c f9 ee c1 85 db 68 c0 03 ef c1 74 17 66 8b 43

In the mail log:

Dec  6 00:16:16 europa popper[30399]: apop "jjd" [pop_apop.c:214]
Dec  6 00:16:16 europa popper[30399]: jjd at [hostname] ([ip]): -ERR [SYS/TEMP] POP authentication DB not available (user jjd): No such file or directory (2) [pop_apop.c:249]

The machine was reset around 00:40 or 00:50.

Before the update (friday) it had a uptime of 100 days. It only went down
because it had to be moved to another rack.

All filesystems are reiser. Unfortunately the machine wasn't installed as a
backup server / dns server, and it wasn't prepared for use by customers. To
be able to use quota I was forced to create two filesystems (document root
and mail spool) on loopback filesystem.
The partitions reside on a 3ware IDE raid controller.

I have no clue whatsoever why it would attempt to access the cdrom drive.
I'm not even sure it the machine has one, and it certainly should not be
mounted.

-- 
Erik Hensema (erik@hensema.net)

kupdated in uninterrupatable sleep after kernel update

Erik Hensema

Philippe Vogel

Erik Hensema

Volker Kuhlmann

Thomas Seliger

Ferdinand Schmid

Steffen Dettmer

Erik Hensema

Roger Hayter

tags

participants (7)