Moin zusammen,
ich habe ein mittlerweile gravierendes Problem mit LVM und snapshots. Zur Vorgeschichte: Ich sichere diverse Filesysteme (LVs) regelmässig per cron-job auf eine andere interne Platte. Somit kann mein Rechner im Falle eines HD-Ausfalls von der Backup Platte hochgefahren werden (mit "fast aktuellem" Datenbestand).
Dazu passiert im Skript folgendes: a) anlegen eines read-only Snapshot-LVs via lvcreate b) mount des Snapshots c) sichern via rsync d) umount e) löschen des Snapshots via lvremove
Das lief lange Zeit ohne Probleme. Dann aber passierte es erst manchmal, später immer öfter und nun eigentlich immer, das der LVM sich beim anlegen oder spätestens beim löschen des Snapshots völlig verläuft.
Das Ende ist dann (für mich völlig unverständlich) wie z.B. gestern:
- der lvcreate für das Snapshot-Volume für /usr geht; der mount geht; der umount geht. Der lvremove hängt! Selbst ein kill -9 auf den Prozess hilft nicht. - Gleichzeitig lässt sich eigentlich nichts mehr starten, was in /usr/bin etc. liegt: der Prompt kommt auch hier nicht zurück. - reboot schlägt fehl
Dann Reset: - Rechner bootet; fsck läuft durch (dank XFS sehr schnell) und nun kommts: - das LV für /usr ist verschwunden (nicht physisch, sondern der Inhalt). Ein mount des LVs bringt hier den Inhalt des home-LVs NOCHMAL (das home-LV konnte normal gemountet werden). - Aber laut vgdisplay sind zwei GETRENNTE LVs vorhanden!
löschen des defekten usr-LVs sowie des noch vorhanden alten (unavail) snapshot-LVs geht. Neuanlegen, Backup einspielen und mounten geht -> Rechner läuft wieder.
Der Rechner meldet aber KEINEN einzigen Fehler im Zusammenhang mit LVs.
Was zum Henker passiert hier? Oder wo könnte man diese Frage besser adressieren?
Ich traue mich z.Zt. nicht mehr ein Snapshot-LV anzulegen.
Any Ideas?
Andreas
(zu unverständlich beschrieben? -> Fragen!)