SuSE 10.2 / LVM / /home ist plötzlich nur noch read only
Hallo allerseits, ich hab' mir hier eine SuSE 10.2 neu aufgesetzt. Nun ist es mir bereits ein paar mal passiert, daß /home, welches auf einer "LVM-Partition" liegt plötzlich nur read-only zugreifbar ist. mount zeigt weiterhin an, daß /home rw gemountet sei. Es scheint mir, daß das Problem gelegentlich auftritt, wenn ich ein snapshot von /home anlege. Hat jemand ähnliche Erfahrungen gemacht? Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Am Freitag, 5. Januar 2007 11:14 schrieb Dr. Jürgen Vollmer:
ich hab' mir hier eine SuSE 10.2 neu aufgesetzt. Nun ist es mir bereits ein paar mal passiert, daß /home, welches auf einer "LVM-Partition" liegt plötzlich nur read-only zugreifbar ist. mount zeigt weiterhin an, daß /home rw gemountet sei.
zur Vollständigkeit, heute Nachmittag ist das wieder aufgetreten. Hier der relevante Ausschniott aus /var/log/messages: Jan 5 17:59:27 x kernel: JBD: barrier-based sync failed on dm-0 - disabling barriers Jan 5 17:59:29 kernel: kjournald starting. Commit interval 5 seconds Jan 5 17:59:29 kernel: EXT3-fs: dm-1: orphan cleanup on readonly fs Jan 5 17:59:29 kernel: ext3_orphan_cleanup: deleting unreferenced inode 1000132 Jan 5 17:59:29 kernel: ext3_orphan_cleanup: deleting unreferenced inode 1000090 Jan 5 17:59:29 kernel: EXT3-fs: dm-1: 2 orphan inodes deleted Jan 5 17:59:29 kernel: EXT3-fs: recovery complete. Jan 5 17:59:29 kernel: JBD: barrier-based sync failed on dm-1 - disabling barriers Jan 5 17:59:29 kernel: EXT3-fs: mounted filesystem with ordered data mode. Jan 5 17:59:30 kernel: Aborting journal on device dm-0. Jan 5 17:59:30 kernel: journal commit I/O error Jan 5 17:59:30 kernel: ext3_abort called. Jan 5 17:59:30 kernel: EXT3-fs error (device dm-0): ext3_journal_start_sb: Detected aborted journal Jan 5 17:59:30 kernel: Remounting filesystem read-only Wer oder was ist JBD? So long & Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Hallo, auch auf die Gefahr hin, daß ich mich hier mit mir selbst unetrhalte, noch ein Nachtrag zu: Am Freitag, 5. Januar 2007 18:13 schrieb Dr. Jürgen Vollmer:
Am Freitag, 5. Januar 2007 11:14 schrieb Dr. Jürgen Vollmer:
ich hab' mir hier eine SuSE 10.2 neu aufgesetzt. Nun ist es mir bereits ein paar mal passiert, daß /home, welches auf einer "LVM-Partition" liegt plötzlich nur read-only zugreifbar ist. mount zeigt weiterhin an, daß /home rw gemountet sei.
zur Vollständigkeit, heute Nachmittag ist das wieder aufgetreten. Hier der relevante Ausschniott aus /var/log/messages:
Jan 5 17:59:27 x kernel: JBD: barrier-based sync failed on dm-0 - disabling barriers
das (barrier=off) hab' ich noch gefunden: https://secure-support.novell.com/KanisaPlatform/Publishing/952/3907838_f.SA... mail schauen, ob es etwas hilft. Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Hallo, Am Fre, 05 Jan 2007, Dr. Jürgen Vollmer schrieb:
Wer oder was ist JBD?
==== /usr/src/linux/fs/Kconfig ==== config JBD tristate help This is a generic journaling layer for block devices. It is currently used by the ext3 and OCFS2 file systems, but it could also be used to add journal support to other file systems or block devices such as RAID or LVM. If you are using the ext3 or OCFS2 file systems, you need to say Y here. If you are not using ext3 OCFS2 then you will probably want to say N. To compile this device as a module, choose M here: the module will be called jbd. If you are compiling ext3 or OCFS2 into the kernel, you cannot compile this code as a module. ==== Das ist das, was beim 'make *config' als Hilfe angezeigt wird. Zu deinem eigentlichen Problem weiß ich leider auch nix, aber das I/O-Error ist normalerweise nix gutes... -dnh --
You start with half a bottle of red wine and chillis to taste ... -- R. P. Grant You start out with a lot more than half a bottle - it is a real bad chef who doesn't sample his ingredients to make sure they are just right. -- srs (hic) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo Jürgen, hallo Leute, Am Freitag, 5. Januar 2007 18:13 schrieb Dr. Jürgen Vollmer:
Am Freitag, 5. Januar 2007 11:14 schrieb Dr. Jürgen Vollmer:
ich hab' mir hier eine SuSE 10.2 neu aufgesetzt. Nun ist es mir bereits ein paar mal passiert, daß /home, welches auf einer "LVM-Partition" liegt plötzlich nur read-only zugreifbar ist. mount zeigt weiterhin an, daß /home rw gemountet sei. [...] Jan 5 17:59:30 kernel: EXT3-fs error (device dm-0): ext3_journal_start_sb: Detected aborted journal Jan 5 17:59:30 kernel: Remounting filesystem read-only
Du hast das "error behaviour" Deines ext3 auf "remount-ro" eingestellt (siehe dazu man tune2fs) - was eine gute Idee ist, damit ein kaputtes Dateisystem nicht noch kaputter gemacht wird, bis das Problem auffällt. Irgendwas ist also an Deinem Dateisystem kaputt - Du solltest einen fsck laufen lassen. Auch ein badblocks-Lauf kann nicht schaden. Gruß Christian Boltz -- Vermutlich initialisiert das BIOS die Hardware nur halb, und die andere Hälfte hängt vom Wasserstand in der Pegnitz und der Mondphase ab. [Stefan Seyfried in suse-laptop] -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am Sonntag, 7. Januar 2007 23:53 schrieb Christian Boltz:
Am Freitag, 5. Januar 2007 18:13 schrieb Dr. Jürgen Vollmer:
Am Freitag, 5. Januar 2007 11:14 schrieb Dr. Jürgen Vollmer:
ich hab' mir hier eine SuSE 10.2 neu aufgesetzt. Nun ist es mir bereits ein paar mal passiert, daß /home, welches auf einer "LVM-Partition" liegt plötzlich nur read-only zugreifbar ist. mount zeigt weiterhin an, daß /home rw gemountet sei.
[...]
Jan 5 17:59:30 kernel: EXT3-fs error (device dm-0): ext3_journal_start_sb: Detected aborted journal Jan 5 17:59:30 kernel: Remounting filesystem read-only
Du hast das "error behaviour" Deines ext3 auf "remount-ro" eingestellt (siehe dazu man tune2fs) - was eine gute Idee ist, damit ein kaputtes Dateisystem nicht noch kaputter gemacht wird, bis das Problem auffällt.
Mein Versuch mit "barrier=off" beim booten hat auch nichts geholfen. Heute morgen hatte ich wieder einen Aussetzer. Ich bin mir inzwischen auch ziemlich sicher, daß das Problem immer im Zusammenhang mit dem Erzeugen von LVM-Snapshots steht: Zuerst wird das Snapshot erzeugt, und danach passiert es (manchmal).
Irgendwas ist also an Deinem Dateisystem kaputt - Du solltest einen fsck laufen lassen. Auch ein badblocks-Lauf kann nicht schaden.
werd's mal heute nacht laufen lassen, das dauert ja ewig... Die Platte ist allerdings eine nagelneue SCSI-Platte, sollte :-) eigentlich ok sein. Nach dem Fehlermeldungen googlen drängt sich mir allerdings der Eindruck auf, daß es sich eher um ein Kernel-problem mit ext3 handelt. Wenn der fsck also nichts anmeckert, werd' ich halt das ganze wieder auf reiserfs kopieren. Damit hatte ich bisher noch nie Probleme. Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo Jürgen, Am Montag, 8. Januar 2007 09:20 schrieb Dr. Jürgen Vollmer:
Am Sonntag, 7. Januar 2007 23:53 schrieb Christian Boltz:
Am Freitag, 5. Januar 2007 18:13 schrieb Dr. Jürgen Vollmer:
Am Freitag, 5. Januar 2007 11:14 schrieb Dr. Jürgen Vollmer:
ich hab' mir hier eine SuSE 10.2 neu aufgesetzt. Nun ist es mir bereits ein paar mal passiert, daß /home, welches auf einer "LVM-Partition" liegt plötzlich nur read-only zugreifbar ist. mount zeigt weiterhin an, daß /home rw gemountet sei.
[...]
Jan 5 17:59:30 kernel: EXT3-fs error (device dm-0): ext3_journal_start_sb: Detected aborted journal Jan 5 17:59:30 kernel: Remounting filesystem read-only
Du hast das "error behaviour" Deines ext3 auf "remount-ro" eingestellt (siehe dazu man tune2fs) - was eine gute Idee ist, damit ein kaputtes Dateisystem nicht noch kaputter gemacht wird, bis das Problem auffällt.
Mein Versuch mit "barrier=off" beim booten hat auch nichts geholfen. Heute morgen hatte ich wieder einen Aussetzer.
Ich bin mir inzwischen auch ziemlich sicher, daß das Problem immer im Zusammenhang mit dem Erzeugen von LVM-Snapshots steht: Zuerst wird das Snapshot erzeugt, und danach passiert es (manchmal).
ich bin jetzt nicht der LVM-Snapshot-Spezi hab aber noch im Hinterkopf, das für Snapshots ein Speicherbereich der Platte (oder auch im LVM) verwendet wird um die Änderungen während des Snapshots zwischen zu speichern. Wenn dieser Bereich voll oder irgendwie schadhaft ist könnte das deine Probleme erklären.
Irgendwas ist also an Deinem Dateisystem kaputt - Du solltest einen fsck laufen lassen. Auch ein badblocks-Lauf kann nicht schaden.
werd's mal heute nacht laufen lassen, das dauert ja ewig...
Die Platte ist allerdings eine nagelneue SCSI-Platte, sollte :-) eigentlich ok sein.
es gibt auch 'logische' Fehler, sogar auf neuen Platten :-(
Nach dem Fehlermeldungen googlen drängt sich mir allerdings der Eindruck auf, daß es sich eher um ein Kernel-problem mit ext3 handelt. Wenn der fsck also nichts anmeckert, werd' ich halt das ganze wieder auf reiserfs kopieren. Damit hatte ich bisher noch nie Probleme.
Bye Jürgen
-- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Viel Glück Rolf Masfelder -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am Montag, 8. Januar 2007 10:21 schrieb Rolf Masfelder:
Ich bin mir inzwischen auch ziemlich sicher, daß das Problem immer im Zusammenhang mit dem Erzeugen von LVM-Snapshots steht: Zuerst wird das Snapshot erzeugt, und danach passiert es (manchmal).
ich bin jetzt nicht der LVM-Snapshot-Spezi hab aber noch im Hinterkopf, das für Snapshots ein Speicherbereich der Platte (oder auch im LVM) verwendet wird um die Änderungen während des Snapshots zwischen zu speichern.
genauer: es müssen noch einige physical extends in der Volume-Gruppe frei sein.
Wenn dieser Bereich voll oder irgendwie schadhaft ist könnte das deine Probleme erklären.
wenn der Bereich voll ist, dann sehen die Probleme anders aus (hatt' ich schon). Aber das ist hier nicht der Fall. Inbes. tritt das Problem unmittelbar nach dem Anlegen des Snapshots auf. Ich hab' 4 GB für das Snapshot reserviert, das sollte (bei mir hier) morgens um 6 Uhr für einige Zeit reichen.
Irgendwas ist also an Deinem Dateisystem kaputt - Du solltest einen fsck laufen lassen. Auch ein badblocks-Lauf kann nicht schaden.
werd's mal heute nacht laufen lassen, das dauert ja ewig...
Die Platte ist allerdings eine nagelneue SCSI-Platte, sollte :-) eigentlich ok sein.
es gibt auch 'logische' Fehler, sogar auf neuen Platten :-(
ja, leider.... Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Hallo, On Monday 08 January 2007 09:20, Dr. Jürgen Vollmer wrote:
Die Platte ist allerdings eine nagelneue SCSI-Platte, sollte :-) eigentlich ok sein.
Nur so eine Idee. Da ich nicht weiss, was du fuer ein SCSI-System hast: ist die Termininierung des SCSI-Busses einwandfrei, bzw. der Bus wirklich sauber? D.h. also auch gute Kabel richtige Einstellung am Controller falls manuelle Terminierungseinstellung, usw. Der LVM erzeugt bei manchen Aenderungen recht flotten Traffic, da ja viele Schreibvorgaenge im LV auch zuerst noch einen Lesevorgang des LV und einen Schreibvorgang im LV-Snapshot ausloesen. Roman -- Roman Fietze Telemotive AG Büro Mühlhausen
Am Montag, 8. Januar 2007 10:40 schrieb Roman Fietze:
On Monday 08 January 2007 09:20, Dr. Jürgen Vollmer wrote:
Die Platte ist allerdings eine nagelneue SCSI-Platte, sollte :-) eigentlich ok sein.
Nur so eine Idee.
Da ich nicht weiss, was du fuer ein SCSI-System hast:
Adaptec 29320ALP Ultra320 SCSI adapter aic7901: Ultra320 Wide Channel A, SCSI Id=7, PCI 33 or 66Mhz, 512 SCBs
ist die Termininierung des SCSI-Busses einwandfrei, bzw. der Bus wirklich sauber? D.h. also auch gute Kabel richtige Einstellung am Controller falls manuelle Terminierungseinstellung, usw.
alles neu: Gehäuse, Motherboard, CPU, Kabel, Platte ich werd' den Rechner aber heute nochmal aufschrauben, und überall 'dran rütteln....
Der LVM erzeugt bei manchen Aenderungen recht flotten Traffic, da ja viele Schreibvorgaenge im LV auch zuerst noch einen Lesevorgang des LV und einen Schreibvorgang im LV-Snapshot ausloesen.
nun ja, andere Anwendungen, z.B. VMWARE (viel Plattenaktivität, wenn man die VM suspendiert) verursachen kein Problem. Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Hallo, Am Mon, 08 Jan 2007, Dr. Jürgen Vollmer schrieb: [..]
Nach dem Fehlermeldungen googlen drängt sich mir allerdings der Eindruck auf, daß es sich eher um ein Kernel-problem mit ext3 handelt. Wenn der fsck also nichts anmeckert, werd' ich halt das ganze wieder auf reiserfs kopieren. Damit hatte ich bisher noch nie Probleme.
Schau mal in http://www.kernel.org/pub/linux/kernel/v2.6/testing/ChangeLog-2.6.20-rc3 nach VM: Fix nasty and subtle race in shared mmap'ed page writeback Das scheint lt. der debian-user-german bzw. lt. einer Diskussion auf der lkml (Problembeschreibung von Marc Haber) auch Probleme bei ext3 / LVM zu machen. Mit XFS gab's wohl auch Probleme. Ob der Kernel der SUSE betroffen ist weiss ich nicht. -dnh -- 78: Kinderpornographie im Internet Schwarzer Peter für den nächsten Wahlkampf (Florian Kuehnert) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo David,
Am Mon, 08 Jan 2007, Dr. Jürgen Vollmer schrieb: [..]
Nach dem Fehlermeldungen googlen drängt sich mir allerdings der Eindruck auf, daß es sich eher um ein Kernel-problem mit ext3 handelt. Wenn der fsck also nichts anmeckert, werd' ich halt das ganze wieder auf reiserfs kopieren. Damit hatte ich bisher noch nie Probleme.
Schau mal in
http://www.kernel.org/pub/linux/kernel/v2.6/testing/ChangeLog-2.6.20-rc3
nach
VM: Fix nasty and subtle race in shared mmap'ed page writeback
Das scheint lt. der debian-user-german bzw. lt. einer Diskussion auf der lkml (Problembeschreibung von Marc Haber) auch Probleme bei ext3 / LVM zu machen. Mit XFS gab's wohl auch Probleme.
Ob der Kernel der SUSE betroffen ist weiss ich nicht.
Nun ja da scheint ja im Kernel 2.6.20 etwas behoben zu sein. Nur: was mache ich jetzt mit diesem Wissen? Einen neuen Kernel übersetzen? Meine letzten Kernel-Compile-Orgien sind schon eine Weile her, ich würd' also gerne darauf verzichten. Warten bis SuSE einen neuen Kern liefert, das kann dauern :-) Was sonst? Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
participants (5)
-
Christian Boltz
-
David Haller
-
Dr. Jürgen Vollmer
-
Rolf Masfelder
-
Roman Fietze