bolug bonner linux user group
news about wissen files archive hilfe suchen  

 

archive :: SchAN-User

druckfassung

SchAN-User

[Schan-user] System-Festplatte unter 5.3.2 abgeraucht - wieder ok

To: schan-user@xxxxxxxxxxxxxxxxx
Subject: [Schan-user] System-Festplatte unter 5.3.2 abgeraucht - wieder ok
From: Alexander Eufe <beamer@xxxxxxxx>
Date: Thu, 11 Oct 2012 19:51:43 +0200
...puh, das ist nochmal gutgegangen.
Nachdem sich glücklicherweise herausgestellt hatte, dass 'nur' die System-Festplatte defekt war, liess sich das System nach einer Sicherungsorgie der Sicherungsdateien (sicher ist sicher) wiederherstellen.

Wen´s interessiert, hier der Kurzbericht:

-kompletten Festplattenkäfig raus und an einen PC mit zwei leeren Festplatten gehängt (mehr Handlungsspielraum als im Serverschrank und dem zugestrapsten Servergehäuse).

-mit partedmagic+clonezilla von USB die zwei verbliebenen Festplatten geclont, also 1:1 gesichert.

-die Festplatte mit der veralteten geclonten Arktur-Installation solo ins System an SATA0 des Mainboards wieder rein und mit der Arktur-CD wieder bootbar gemacht.

-Test: OK, wobei sich beim ersten Hochfahren die Internetverbindung verabschiedet hatte: Bei uns ist Internet beim Start+sntp/ntp aktiviert. Nach ca. 10 Min. vergeblicher Suche nach einem Zeitserver die Meldung: "router1 (unsere Internetverbindung) ist schon online"....???. Nach einem Neustart alles i.O. ...!?

-nach <init 0> die zweite Festplatte wieder angeschlossen, logischerweise an SATA1 des Mainboards, damit diese Festplatte /dev/sdb wird und die /etc/fstab weiter Bestand hat. Hier hatte ich dann das Problem, dass sich "Wurzel" aus der Sicherung nicht über das laufende System kopieren liess..eigentlich ja auch logisch. Also wieder pmagic (Admin´s Liebling!!) von USB gestartet und nach Überprüfung der Laufwerks-/Partitionszuordnungen und entsprechendem Mounten den <cp -aux>-Befehl abgesetzt. Es lief! :) Einziger Wermutstropfen: selbst ein <-f> an <cp -aux> verhinderte nicht die nervigen Nachfragen, ob Datei xyz überschrieben werden sollte; keine Ahnung, woran das lag. Egal.

-Test: <init 0> und Festplatte 2 wieder abgezogen und Start: Das aktuelle System startete! Gleicher Fehler bei Internet-Verbindung: Neustart und..es lief!! Hurra, wir waren wieder da!

-Nachdem das nun geklärt war, die nächste Aufgabe: Festplatte 3 wieder etablieren und Sicherungsplan wiederherstellen. Also:
System: SATA 0 (/dev/sda, war vorher sdc, also die 1:1-Kopie)
neue 1TB Festplatte: SATA 1 (dev/sdb, als Sicherungsplatte )
Festplatte 2: SATA 2 (/dev/sdc, vorher sdb/rsnapshot-Sicherung, jetzt als 1:1-Kopie)

-Wieder pmagic gestartet und mit partedmagic und clonezilla die Festplatten entsprechend eingerichtet und sda nach sdc geclont. -die /etc/fstab (immer noch unter pmagic) auf die neue Sicherungspartition abgeändert

-Neustart und hoffen.....
Kurzmeldung von Lilo -vor dem Bootmenü- (sinngemäss): "Error. Multiple Volume ID´s"..Das war´s, denke ich..dann ohne Tastendruck oder ähnliches das Boot-Menü, dann System-Start, als wäre nie was gewesen.. puuh..

-Überprüfungen:
>fdisk -l
>df
>cat /etc/fstab
>cat /etc/lilo.conf
>rsnapshot configtest
>crontab -l -u root

-manuell das Backup angeschoben mittels <mach-back>. Kontrolle desselbigen. Alles gut.

-Neustart: Lilo says Error, aber sauberer Start. Anmeldung ist möglich, alle sind happy und ich der Held..;) Zeitaufwand: ca. 6 Stunden, von denen ich die meiste Zeit mit Warten und Drücken von <y> und <Enter> verbracht habe...

Nur die Lilo-Fehlermeldung ganz am Anfang irritiert mich. Das wird wohl damit zusammenhägen, dass ich beim Anlegen der neuen Sicherungsplatte das gleiche Label wie das der vorherigen Festplatte verwendet habe? Weiss da vlt. jemand was?

Gruss Alexander

Am 08.10.2012 22:31, schrieb Alexander Eufe:
Moin Liste,
Ohne offensichtliche Gründe "ist der Server abgeraucht". Das Ganze
geschah wohl am Do., 4.10.2012.

Die Mail an die Chefin, die den Zustand erklärt:

---snip---
moin Claudia,
der Server-GAU ist eingetreten..kann es nur als Prüfung werten, wie gut
meine Backup-Konfiguration war....

Status:
Festplatte 1 (System) völiig geschrotet
Festplatte 2 (Datenbackup) teilweise nicht zugriffsbereit, aber:
Festplattenbereich mit den BackupBenutzerdaten scheint nicht betroffen
Backup-Auftrag wurde bis Do.,04.10.2012, 4:35Uhr brav ausgeführt ->was
ist am frühen Do. bloss passiert? Erdbeben?!?!?!?! Das Testprogramm
spuckt nur Lesefehler aus und stoppt dann..
Festplatte 3 (1:1-Kopie der System-Festplatte) scheint nicht betroffen

Aufgaben:
System wieder startfähig machen
aktuelle Benutzerdaten aus den Backups wiederherstellen
persistente Server-Konfiguration wiederherstellen
die kaputte Festplatte dem Händler um die Ohren hauen
ein Feldbett+Kaffeemaschine in den Serverraum stellen

scheisse

lg alex
---snap---

Infos:
Den Diagnosebericht zum Zustand der Festplatten (alle 3 Seagate
ST500DM002-1BC142, 500GB) hat das Tool <SeaTools 2.1> geliefert. Bei
Festplatte 1 hagelts wie gesagt Lesefehler im Intensivtest, dabei ist
das System grade mal ein halbes Jahr im Dienst.. (Plattform: Intel
Serverboard SB1200)

wie oben bereits in Klammern angedeutet: kein RAID, sondern SATA im
AHCI-Modus

Die Spiegelung auf Festplatte 3 enhält ein nicht aktuelles System-Clone
der System-Festplatte 1

keine weiteren Backups des aktuellen Systems vorhanden

Fragen:
wenn es mir gelingt, aus Festplatte 3 einen arktur-Server von vor etwa 4
Monaten zu starten, mit welchem Befehl stelle ich am effektivsten die
mit rsnapshot erstellten Backupdateien von Festplatte 2 wieder her?


wünscht mir Glück

_______________________________________________
schan-user mailing list
schan-user@xxxxxxxxxxxxxxxxx
http://www.heise.de/bin/newsletter/listinfo/schan-user

_______________________________________________
schan-user mailing list
schan-user@xxxxxxxxxxxxxxxxx
http://www.heise.de/bin/newsletter/listinfo/schan-user

 

seitenanfang


 

news about wissen files archive hilfe suchen  
kontakt letzte änderung: 11.10.2012