Tips für das Backup großer Laufwerke

von Aron Vrtala (Ausgabe 02/2, Oktober 2002)

 

Irgendwann passiert es jedem Administrator eines größeren Servers: Eine Platte ist defekt, oder das RAID gibt auf. Für professionelle Server-Betreiber kein Problem - sie haben die Daten ihres Systems regelmäßig auf Band gesichert, z.B. über das Backup-Service des ZID. Nach erfolgter Reparatur wird daher der Backup-Klient aufgerufen, um die Daten vom Backup-Server zurückzuholen. Doch dann vergehen die Stunden, und noch immer sind nicht mehr als 10% übertragen...

Warum dauert das so lang?

Im Rahmen eines Backup-Vorgangs werden die Daten eines Rechners zuerst auf einen großen Plattenbereich des Backup-Servers gespeichert, in der Backup-Datenbank registriert und anschließend auf Bänder überspielt. Dadurch gelangen häufig Daten von verschiedenen Systemen auf ein Medium. Beim ersten Sicherungsvorgang des Rechners werden alle Dateien weitestgehend zusammenhängend gesichert; deshalb nimmt auch das Zurückspeichern der Daten (Restore) für ein neues System kaum mehr Zeit in Anspruch als der erste Sicherungslauf. Das folgende tägliche Backup berücksichtigt dann aber üblicherweise nur mehr die neuen und die geänderten Daten ("inkrementelles Backup"), sodaß die aktuellen Versionen der Dateien eines Rechners nach und nach auf eine große Anzahl von Bändern verteilt werden. Die unvermeidbare Folge ist, daß das Zurückholen eines Dateisystems mit der Zeit immer länger dauert: Obwohl der Bandroboter des Backup-Servers im Schnitt nur 1,5 Minuten benötigt, um ein einzelnes Band für das Auslesen von Daten zu laden und zu positionieren, kann bei einer größeren Datenmenge allein schon die Vorbereitungszeit mehrere Stunden betragen.

Ein weiterer Faktor - der aufgrund der immer schnelleren Netzwerkinfrastruktur jedoch an Bedeutung verliert - ist die verfügbare Bandbreite. Wenn die Verbindungsgeschwindigkeit zum Backup-Server gering ist, trägt die Transferzeit der Daten über das Internet wesentlich zur Verzögerung bei (zur Abschätzung läßt sich die Dauer des ersten Sicherungsvorgangs heranziehen, bei dem der gesamte Festplatteninhalt zum Backup-Server übertragen wurde). Vermeiden Sie in diesem Sinne beim Backup auch jeden Netzwerkzugriff auf Datenbereiche in anderen Rechnern!

Auch die Leistungsfähigkeit Ihres Rechners spielt eine wesentliche Rolle, da Komprimierung und Dekomprimierung von Daten lokal viel Rechenleistung und Arbeitsspeicher verbrauchen. Eine eher langsame CPU stört zwar bei inkrementellen Backups kaum, beim Restore einer ganzen Festplatte fällt die Rechenzeit aber sehr wohl ins Gewicht.

Gegenmaßnahmen

Schlußendlich entscheiden auch die Art Ihres Rechners, Ihr Betriebssystem und die Datenanordnung auf Ihrem Gerät, wie schnell oder langsam ein Restore vor sich geht. Hier können Sie durch ein geeignetes Datenmanagement ganz wesentlich eingreifen. Auf jedem PC mit größerer Festplatte genügen zwei Maßnahmen, um die Performance erheblich zu verbessern:

  • Vermeiden Sie das En bloc-Sichern zu großer Datenbereiche. Wir empfehlen aus mehrjähriger Erfahrung, die Größe von etwa 30 bis 40 GB nicht zu überschreiten. Selbst ein 30 GB-Dateisystem enthält bereits sehr viele einzelne Dateien, und die Ein-/Ausgabebelastung über die Wurzel des Dateisystems (der oberste Punkt, beispielsweise C:\ unter Windows oder / unter Unix) wird rasch zum limitierenden Faktor. Der Verbrauch von Arbeitsspeicher beim Backup wie auch beim Restore nimmt mit der Größe der Dateisysteme stark zu.
  • Legen Sie mehrere Bereiche (Partitionen oder Festplatten) für wichtige und weniger wichtige Daten an. Durch diese einfache Einteilung auf Ihrem Server können Sie wesentlich zur raschen Wiederaufnahme der wichtigen Dienste beitragen. Ist z.B. ein RAID mit einer Kapazität von 200 GB ausgefallen, müssen Sie im Falle eines einzigen logischen Datenbereichs warten, bis die letzten Daten zurückgespeichert sind, um das Dateisystem wieder voll in Betrieb nehmen zu können. Wenn Sie diesen Datenbereich aber beispielsweise in fünf Teile teilen, können Sie zuerst die wichtigsten, dann die weniger wichtigen Daten zurücksichern und somit das Service pro Partition bzw. Platte wiederaufnehmen.

Noch sicherer, noch schneller

Bei sehr wichtigen, hoch verfügbaren Servern wird man sich vermutlich nicht mit einem einzigen Backup zufriedengeben, sondern zusätzlich hin und wieder die Daten auch an anderer Stelle sichern - z.B. täglich in den Backup-Server und wöchentlich auf eine lokale Bandstation. Im Ernstfall kann man dann den betroffenen Datenbereich zunächst anhand des lokalen Backups restaurieren, um anschließend den aktuellen Stand durch ein Restore vom Backup-Server vollständig wiederherzustellen.

Neben der höheren Sicherheit hat diese Vorgangsweise den Vorteil, daß die Anzahl der vom Backup-Server zurückzuspeichernden Objekte stark reduziert wird und somit die Wartezeit entsprechend kürzer ist. Wenn Sie diese Methode verwenden, sollten Sie jedoch darauf achten, daß Sie bei Ihrem lokalen Backup keine Aktualisierungsliste mitführen: Beim Eintragen der Archivierungsinformationen durch die Backup-Software werden die gesicherten Dateien automatisch modifiziert, was in Folge die beiden Backup-Klienten gegeneinander ausspielt und fast zwangsläufig zu Verwirrungen und unerwünschten Ergebnissen führt.