Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3 [2019/05/02 19:39] – Pandoc Auto-commit pandocpandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3 [2020/10/20 09:13] (current) – Pandoc Auto-commit pandoc
Line 25: Line 25:
 ====== Derzeitiges Off-Site Backup (2) ====== ====== Derzeitiges Off-Site Backup (2) ======
  
-{{:pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3:vsc_network.png}}+{{.:vsc_network.png}}
  
 ====== Struktur der Daten ====== ====== Struktur der Daten ======
  
-{{:pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3:vsc3_files.png}}+{{.:vsc3_files.png}}
  
 ====== Struktur der Daten (2) ====== ====== Struktur der Daten (2) ======
  
-{{:pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3:vsc2_files.png}}+{{.:vsc2_files.png}}
  
 ====== Struktur der Daten (3) ====== ====== Struktur der Daten (3) ======
  
-{{:pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3:vsc3_space.png}}+{{.:vsc3_space.png}}
  
 ====== Struktur der Daten (4) ====== ====== Struktur der Daten (4) ======
  
-{{:pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3:vsc2_space.png}}+{{.:vsc2_space.png}}
  
 ====== Backup-Maschine ====== ====== Backup-Maschine ======
Line 114: Line 114:
     * Nur 1 Prozess     * Nur 1 Prozess
       * und der macht die halbe Zeit IOWait bei NFS ueber 10G       * und der macht die halbe Zeit IOWait bei NFS ueber 10G
-    * Nur der fuer Aenderungen lauft schon ewig 
     * Funktioniert so nicht bei 750 Mio. Files     * Funktioniert so nicht bei 750 Mio. Files
  
Line 124: Line 123:
 for i in {1..10} for i in {1..10}
 do  do 
-    rsync -avHAXS --delete src/server${i} dest/server${i} & +    rsync -avHAXS --delete src/server${i}dest/server${i}
 done done
 </code> </code>
Line 147: Line 146:
         * Nicht mehr vorhandene Files loeschen         * Nicht mehr vorhandene Files loeschen
       * Neue / geaenderte files mit mehreren Prozessen synchronisieren       * Neue / geaenderte files mit mehreren Prozessen synchronisieren
 +
 +====== Bash/Rsync Magic (4) ======
  
 <code bash> <code bash>
-rsync -avHAXS -f"+ */" -f"- */*" $sourcedir. >/dev/null 2>&&+# Sync Directory Structure 
 +rsync -avHAXS -f"+ */" -f"- */*" src/serverdest/server/ & 
 +# Create Filelists
 ( find src/server/ ! -type d > filelist.txt ( find src/server/ ! -type d > filelist.txt
 sort -R filelist.txt > filelist2.txt sort -R filelist.txt > filelist2.txt
 split -d -a6 -n r/$numProcesses filelist2.txt > filelist.scrambled.txt ) & split -d -a6 -n r/$numProcesses filelist2.txt > filelist.scrambled.txt ) &
 +# Delete obsolete files
 rsync -r --delete --existing --ignore-existing src/server/ dest/server/ & rsync -r --delete --existing --ignore-existing src/server/ dest/server/ &
 wait wait
 +# Sync Files in Filelist
 for ((i=0; i<$numProcesses; i++)) for ((i=0; i<$numProcesses; i++))
 do  do 
Line 161: Line 165:
 done done
 </code> </code>
-====== Bash/Rsync Magic (4) ======+====== Bash/Rsync Magic (5) ======
  
   * Backup mit n-prozessen pro server   * Backup mit n-prozessen pro server
   * Backup Zyklus?   * Backup Zyklus?
-    * Server soll immer eine gewisse load haben+    * Backup-Server soll immer eine gewisse Load haben (Anzahl laufender rsync prozesse)
   * Warteschlange / Queue   * Warteschlange / Queue
-    * Server backuppenwenn fertig signalisieren sie bereitschaft fuer naechstes backup +    * Backup laeuft pro Server. 
-    * Scheduled script checkt Anzahl der Rsync prozesse 1x pro Stunde+    * Script checkt Server, die nicht gerade gebackuppt werden und fuegt sie in Warteschlange ein 
 +      * 1x Taeglich 
 +    * Zweites script checkt Anzahl der laufenden rsync Prozesse
       * Startet backup fuer naechsten Server in Queue       * Startet backup fuer naechsten Server in Queue
 +      * 1x Stuendlich
  
-====== Bash/Rsync Magic (5) ======+====== Bash/Rsync Magic (6) ======
  
-{{:pandoc:arge_storage:05_backup_on_vsc3:backup_on_vsc3:vsc_backup.png}}+{{.:vsc_backup.png}}
  
-====== Bash/Rsync Magic (6) ======+====== Bash/Rsync Magic (7) ======
  
   * Clustercopy.sh   * Clustercopy.sh
     * Erweiterung des Backup-Scripts     * Erweiterung des Backup-Scripts
-    * Zum kopieren von files auf clustern+    * Zum Kopieren von Files auf Clustern
     * Erwartet Liste von Nodes und Anzahl der Prozesse     * Erwartet Liste von Nodes und Anzahl der Prozesse
-      * rsync mit m prozessen auf n nodes +      * rsync mit m Prozessen auf n Nodes 
-    * Speedup fuer parallele dateisysteme+    * Speedup fuer parallele Dateisysteme
  
-====== Bash/Rsync Magic Probleme ======+====== Bash/Rsync Probleme ====== 
 + 
 +  * Out of Memory (ZFS) 
 +    * Directories mit vielen Files? 
 +  * Anzahl der Rsync-Prozesse 
 +  * Rebuild Zeit bei SMR Disks 
 +  * Hinzufuegen neuer Disks 
 +  * ZFS Troubles 
 +  * Bottlenecks 
 +    * SAS 
 +    * Netzwerk 
 +    * CPU/Memory
  
-<code> 
-* Out of Memory (ZFS) 
-* Anzahl der Rsync-Prozesse 
-* Rebuild Zeit bei SMR Disks 
-* Hinzufuegen neuer Disks 
-* ZFS Troubles 
-</code> 
 ====== Ausblick ====== ====== Ausblick ======
  
   * Backup auf Tapes mit IBM Spectrum Protect   * Backup auf Tapes mit IBM Spectrum Protect
-    * 10 TB / Tape +    * Tape Library TU Wien Geodaesie 
-    * 200 MB/s write speed per drive+    * 9 TB / Tape unkomprimiert (LTO-7 M8) 
 +    * 300 MB/s write speed per drive
     * 3 Drives     * 3 Drives
     * 100 Tapes     * 100 Tapes
-    * 1 TSM Server +    * 1 Server 
-    * 2 TSM Clients+    * 2 Clients
  
 ====== Ausblick (2) ====== ====== Ausblick (2) ======
  
-  * TSM Server+  * Spectrum Protect Server
     * 2x Intel Xeon E5-2697V4, 2.3 GHz, 18 Cores / 36 Threads     * 2x Intel Xeon E5-2697V4, 2.3 GHz, 18 Cores / 36 Threads
     * 512 GB Ram     * 512 GB Ram
  • pandoc/arge_storage/05_backup_on_vsc3/backup_on_vsc3.1556825972.txt.gz
  • Last modified: 2019/05/02 19:39
  • by pandoc