data domain backup & recovery

39
1 © Copyright 2009 EMC Corporation. All rights reserved. EMC Backup & Recovery Solutions: Backup to the Future Lucian Gavris Account Manager EMC Backup Recovery Solution Divison [email protected] +49 171 499 7171 Kurt Kraus Advisory Technology Consultant EMC Backup Recovery Solution Divison [email protected]

Upload: netlogix

Post on 17-May-2015

2.400 views

Category:

Technology


1 download

DESCRIPTION

EMC Backup & Recovery Solutions: Backup to the Future

TRANSCRIPT

Page 1: Data Domain Backup & Recovery

1© Copyright 2009 EMC Corporation. All rights reserved.

EMC Backup & Recovery

Solutions:

Backup to the Future

Lucian Gavris

Account Manager

EMC Backup Recovery Solution Divison

[email protected]

+49 171 499 7171

Kurt Kraus

Advisory Technology Consultant

EMC Backup Recovery Solution Divison

[email protected]

Page 2: Data Domain Backup & Recovery

2© Copyright 2009 EMC Corporation. All rights reserved.

Backup entwickelt sich fort

Vor Ort Ausgelagert

Konventionell

(bandbasiert)

Neuartig

(plattenbasiert)

Backup- und

Medien-

Verwaltung

Backup-

Speicher

vor Ort

Disaster

Recovery

Storage

Anwendungs-

Backup-

Klienten

Avamar

NetWorkerDisk

LibraryVTL/Band

VM

NetWorker Band Band

Data DomainNetWorker

Backup/Recovery

Architektur

Data Protection Advisor

Page 3: Data Domain Backup & Recovery

3© Copyright 2009 EMC Corporation. All rights reserved.

Warum nutzen Großunternehmen immer noch Bänder?

• Niedrige Anschaffungskosten

• Bänder können die massive Menge an redundanten Daten aus Backups speichern

• Auslagerung an zweiten Standort

BAND

PLATTE

Backup

Speicher

5-10fache

Kapazität

Primär-

speicher

Page 4: Data Domain Backup & Recovery

4© Copyright 2009 EMC Corporation. All rights reserved.

Kostenvorteile durch Deduplizierung

Traditioneller Plattenspeicher Deduplizierungsspeicher

Page 5: Data Domain Backup & Recovery

5© Copyright 2009 EMC Corporation. All rights reserved.

EMC BRS Marktpositionen

Avamar – Führende Deduplizierungs-Backupsoftware weltweit

– 4.500 Installationen

– 2.500 Kunden

Data Domain – Führender Deduplizierungsspeicher weltweit

– 12.000 Installationen

– 4.300 Kunden

Disk Library – Bestverkaufte VTL weltweit

– Mehr als 1 Mrd. US-$ Umsatz

NetWorker – Unter den ersten drei Unternehmens-Backuplösungen

– 30.000 Kunden

Page 6: Data Domain Backup & Recovery

6© Copyright 2009 EMC Corporation. All rights reserved.

Analysten über Data Domain

―The leading supplier of data deduplication technology from a real-world implementation and

market penetration perspective is Data Domain.‖

―Data Domain is the de facto leader in the market from a

customer deployment perspective.‖

Source: IDC Opinion, Teck Buyer Case Study, Doc. # 216452 Feb 2009

―Data Domain has the largest market share, both in terms of

customers and appliances in production.‖

―Data Domain is a vendor that has the most ‘mind share’ in the deduplication space and

was an early provider with this technology.‖

Source: Gartner Report ID Number: G00165744 ―Four Technologies That Mid-sized Businesses Should Consider‖ Feb 2009

―Data Domain has 54% deduplication market share.‖

Source: The Taneja Group, September 2008

Page 7: Data Domain Backup & Recovery

7© Copyright 2009 EMC Corporation. All rights reserved.

Data Domain Deduplizierungsspeicher

Einfache Integration in bestehende Umgebungen

Replication

CIFS, NFS,

NDMP, OpenStorage

Ethernet

VTL over FC

DD880 Appliance

4 Höheneinheiten

2 - 6 Ports

10 und 1 Gbit Ethernet; 4 Gbit Fibre Channel

RAID-6

5,4 bis 71 TByte nutzbare Kapazität

1 TByte oder 500 GByte 7,2k U/min SATA-Laufwerke

Dateisystem

NVRAM

N+1 Lüfter und redundante Hotplug-Netzteile

DD880 Appliance

Backup & Archiv

Anwendungen

Page 8: Data Domain Backup & Recovery

8© Copyright 2009 EMC Corporation. All rights reserved.

Hierarchie der Datenreduzierungs-möglichkeiten für Backups

Standard-Speichersystem

1:1

Single-Instance-Speicher

~ 3:1Dateiebene

Fix-Block

~ 3:1Fix-Block,

Snapshots

LZ-Kompression

~ 2:1

Kompression

Backup-Ziel,

Variable Segmente

Variable

Segmente

~ 20:1

Deduplizierung

reduziert deutlich- die benötigte WAN Bandbreite

- den Stromverbrauch

- die Klimaaufwendungen

- die Kühlung

- die Verwaltung

Page 9: Data Domain Backup & Recovery

9© Copyright 2009 EMC Corporation. All rights reserved.

De-Dup Faktor – was heisst das eigentlich?

Faktor Space Saving

1 0%

2 50%

3 67%

4 75%

5 80%

6 83%

7 86%

8 87%

9 89%

10 90%

50 98%

100 99%

500 99.8%

Page 10: Data Domain Backup & Recovery

10© Copyright 2009 EMC Corporation. All rights reserved.

DeDuplizierung – Grundlagen

1. Dateneingang

2. Aufteilung in variable Segmente 4-

12KB und Deduplizierung

3. Komprimierung

4. Schreiben und Verifizieren Index &

Segmentinformationen

Page 11: Data Domain Backup & Recovery

11© Copyright 2009 EMC Corporation. All rights reserved.

Recovery: ―Data Invulnerability‖ Architektur

Zusätzlicher Schutz

• RAID-6

• NVRAM

• N+1 Fan

• n Ports

• Snapshots

Datenüberprüfung

Prüfsumme

DeDup, auf Platte schreiben

Verifizieren

Selbstheilendes File System

Cleaning

Defrag

Verifizieren

Trust but verify – hope is not a strategy !

Page 12: Data Domain Backup & Recovery

12© Copyright 2009 EMC Corporation. All rights reserved.

Second Friday Full Backup

B C D E F L G H

Daten-DeDuplizierungseffekt

A B C D E F G H I J

Friday Full Backup

A B C D A E F G

Mon Incr A B H

Tues Incr C B I

Thurs Incr A C K

Weds Incr E G J

Backup Logical Estimated Physical

Data Reduction

Monday Incr 1 TB 7-10x 100 GB

Tuesday Incr 1 TB 7-10x 100 GB

K L

Wednesday Incr 1 TB 7-10x 100 GB

Thursday Incr 1 TB 7-10x 100 GB

2nd FRIDAY FULL 10 TB 50-60x 180 GB

TOTAL 24 TB 7.8x 3.08 TB

FRIDAY FULL 10 TB 2-4x 2.5 TB

Page 13: Data Domain Backup & Recovery

13© Copyright 2009 EMC Corporation. All rights reserved.

Week 1

April 14 38.0 TB 10x 3.80 TB

April 21 52.0 TB 12x 4.33 TB

April 28 66.0 TB 14x 4.71 TB

May 31 122 TB 17x 7.18 TB

June 30 178 TB 19x 9.37 TB

TOTAL 234 TB 20x 11.7 TB

April 7 24.0 TB 8x 3.08 TB

Längere Aufbewahrungszeiten mit der selben Diskkapazität !

Week 2

Week 3

Month 1

Month 2

Month 3

Month 4 Juli 31 234 TB 20x 11.7 TB

Daten-DeDuplizierungseffektBackup Logical Estimated Physical

Data Reduction

First Full 10.0 TB 4x 2.50 TB

Page 14: Data Domain Backup & Recovery

14© Copyright 2009 EMC Corporation. All rights reserved.

File

Virtualisation

Tier

1

Tier

2

De-duplication Beyond Backup

DR Site

VMware

VMware Infrastructure 3

App

OS

App

OS

App

OS

App

OS

Virtual Machines

VMware

ESX Host

cifs

nfs

vmdk

Snapsho

t

VCB

Proxy

Mainframe/

iSeries/ AS400ESCON

/

FICON

Aussenstellen

WAN

Replikation

SAN

ClientsBackup

NFS OSTCIFS

LAN

Primary

FC/iSCSI/NFS

Storage

NDMP

File Mail

Retention

Lock

Archive Database

SQLSQL

Page 15: Data Domain Backup & Recovery

15© Copyright 2009 EMC Corporation. All rights reserved. 15

Replikation: WAN–Effizienz

WAN

home

home

DIR A

Quelle: Remote Sites

Ziel: Data Center Hub

90- 95% Bandbreitenreduzierung

5- 10%

5- 10%

5- 10%

Echtes DR; reduziert WAN–Kosten; verbessert SLAs !

Backup Daten

Page 16: Data Domain Backup & Recovery

16© Copyright 2009 EMC Corporation. All rights reserved.

DD Replicator Software: One-to-Many Directory ReplicationReplicates the same directory to multiple remote Data Domain systems

Increases protection—multiple copies to different disaster recovery sites

Data distribution for multi-site usage—QA, testing, development

One-to-Many

Source

Destination

Cascaded Replication with One-to-Many

SourceSource and

destination

Destination

Destination

Page 17: Data Domain Backup & Recovery

17© Copyright 2009 EMC Corporation. All rights reserved.

Inline- im Vergleich zu Post-Process-Deduplizierung

Post Process:Deduplizierung nach dem

Speichern

Inline: Deduplizierung vor dem

Speichern

Andere Aktivitäten bleiben unbeeinflußt

− Vorhersagbar

− Einfacher

Deduplizierung

Konkurrierende Prozesse verlangsamen das System

− Kopien auf Band: Zu langsam zum Streamen

− Recovery: SLAs nicht vorhersagbar

− Replikation: findet erst nach Dedup statt

− Deduplizierung selbst kollidiert mit Backup und Restore

Daher höherer Verwaltungsaufwand

Dreifache Zugriffe auf Festplatten

Speichern Deduplizierung

Page 18: Data Domain Backup & Recovery

18© Copyright 2009 EMC Corporation. All rights reserved.

Online vs Post DeDuplizierung

Verifizierung Replikation

Backup

DDUP

Verifizierung ReplikationBackup DDUP

Kein zusätzlicher Plattenbedarf geringere

Stromkosten

Geringere Software-Upgradegebühren

notwendig

Replikation kann unmittelbar mit dem

Backup angestoßen werden DR fähig

Zusätzlicher Platzbedarf höhereStromkosten

Höhere Software-Upgradegebühren notwendig

Extrem I/O-lastig

Anfällig für Datenkonstistenzprobleme / hohe Wahrscheinlichkeit für Diskfragmentierung

Replikation kann erst nach Post-Deduplizierung angestoßen werden DR fähig ?

Online DeDuplizierung Post DeDuplizierung

Page 19: Data Domain Backup & Recovery

19© Copyright 2009 EMC Corporation. All rights reserved.

Leistung: CPU-zentrisch im Vergleich

CPU-zentrisch

Page 20: Data Domain Backup & Recovery

20© Copyright 2009 EMC Corporation. All rights reserved.

Data Domain SISL Scaling Architecture: CPU-Centric

New Q2 Capabilities: Building Upon Data Domain Architectural Advantages

Th

rou

gh

pu

t G

B/s

Addressable capacity in terabytes

post-RAID (physical)

1.25 70 > PB

1.5

0.04

5

3

DD880, July 2009Industry’s fastest backup storage controller

Multi-controller systems with global deduplication

Distributed processing for single-controller systems

DD200 (2004)

2011 (est.)

Page 21: Data Domain Backup & Recovery

21© Copyright 2009 EMC Corporation. All rights reserved.

New Q2 Data Domain Systems and SoftwareRetain, replicate, recover…better

Systems

New Data Domain Global Deduplication Array– Largest, fastest Data Domain deduplication storage system

Data Domain DD880 expansion– Double the capacity

Software

New Data Domain Boost software– Speeds backups by distributing parts of deduplication process to

backup server

New Data Domain Encryption software– Industry’s first encryption of deduplicated data at rest

Data Domain Replicator software enhancements – For small sites and one-to-many directory replication

Available May 2010

Page 22: Data Domain Backup & Recovery

22© Copyright 2009 EMC Corporation. All rights reserved.

Data Domain Global Deduplication ArrayLargest, fastest Data Domain deduplication storage system

Global deduplication and single namespace across two DD880 controllers

– Speed: Up to 12.8 TB per hour (3.5 GB/s)

– Usable capacity: Up to 285 TB

– Logical capacity: Up to 14.2 PB

– Up to 270 concurrent write streams

– As replication target, up to 270 originators

Simplifies backup administration

Managed replication

Upgrade single DD880 to Global Deduplication Array

largest capacity • higher performance •

simplified management

New

Page 23: Data Domain Backup & Recovery

23© Copyright 2009 EMC Corporation. All rights reserved.

Also New: Data Domain DD880 Doubles Capacity

Up to 142.5 TB (up to 7.1 PB logical)

Support for up to 12 shelves

Upgrade kit for existing DD880

Data Domain Operating System 4.8,DD880 12 shelves

DD880

Logical capacity 2.8–7.1 PB

Raw capacity Up to 192 TB

Usable capacity Up to 142.5 TB

Page 24: Data Domain Backup & Recovery

24© Copyright 2009 EMC Corporation. All rights reserved.

DD Boost Software

Distributes parts of deduplication process to backup server – Licensable software works across Data Domain portfolio

Supports majority of backup software market– Symantec NetBackup and Backup Exec currently

– EMC NetWorker support in 2H 2010

Speeds backups by up to 50%

Process more backups with existing resources– 20–40% less overall impact to backup server

– 80–99% less LAN bandwidth

Enables Data Domain replication management from the backup application

New

DD Boost

Page 25: Data Domain Backup & Recovery

25© Copyright 2009 EMC Corporation. All rights reserved.

Distributes Deduplication Process

DATA DOMAIN BOOST

Deduplication process distributed

through DD Boost

Without DD Boost

With DD Boost Software

LAN LAN

Backup serverApplication

LAN LAN

Backup serverApplication

DD Boost

Page 26: Data Domain Backup & Recovery

26© Copyright 2009 EMC Corporation. All rights reserved.

What Gets Distributed?

Speeds backups

Less backup server impact

Less bandwidth

DATA DOMAIN BOOST

ID Segment Unique?

Compress Write

With DD Boost

LAN LAN

Backup serverApplication

DD Boost

Page 27: Data Domain Backup & Recovery

27© Copyright 2009 EMC Corporation. All rights reserved.

DD Boost Across the Portfolio: Up to 50% Faster

DD140 DD610 DD630 DD660 DD690 DD880

Global

Deduplication

Array

DDX Array

Speed (other) 450 GB/hr 675 GB/hr 1.1 TB/hr 2.0 TB/hr 2.7 TB/hr 5.4 TB/hr 86.4. TB/hr

Speed (DD Boost) 490 GB/hr 1.3 TB/hr 2.1 TB/hr 2.7 TB/hr 3.9 TB/hr 8.8 TB/hr 12.8 TB/hr 140 TB/hr

Logical capacity 17–43 TB 75–195 TB 165–420 TB .520–1.31 PB .710–1.7 PB 2.8–7.1 PB 5.7–14 .2 PB 45.6–114 PB

Raw capacity 1.5 TB Up to 6 TB Up to 12 TB Up to 36 TB Up to 48 TB Up to 192 TB Up to 384 TB Up to 3.07 PB

Usable capacity 0.86 TB Up to 3.98 TB Up to 8.4 TB Up to 26.1 TB Up to 35.3 TB Up to 142.5 TB Up to 285 TB Up to 2.28 PB

DDX Array SeriesSoftware options:

DD Boost, DD Virtual Tape Library,

DD Replicator, DD Retention Lock, and

DD Encryption

Up to 16 ControllersDD140 Remote

Office Appliance

DD600

Appliance Series

DD880

Global Deduplication Array

New

Page 28: Data Domain Backup & Recovery

28© Copyright 2009 EMC Corporation. All rights reserved.

DD Encryption SoftwareIndustry’s first encryption of deduplicated data at rest

Protects against loss of disk or system– Inline encryption provides immediate protection

while preserving deduplication

– Works with all protocols and applications

Software-based, user-selectable AES-128 or AES-256

Replicate encrypted data (payload only, not session) using DD Replicator

Inline: deduplication and encryption before storing

Deduplication + Encryption

New

Page 29: Data Domain Backup & Recovery

29© Copyright 2009 EMC Corporation. All rights reserved.

Data Domain Retention Lock Software

Wandelt Data Domain Systeme in ein WORM Medium

mit In-Line Deduplizierung

Schutz gegen alle logischen Fehler

Hohe Kosteneinsparung durch Deduplizierung

Management auf Datei Ebene

Retention Policy’s auf Datei Ebene

Freigabe des Speicherplatzes nach Ablauf der

Retention Zeit

Umfangreiche Kompatibilität

Anbindung an alle gängigen Daten- und

Archivierungsysteme

Datenschutz in Verbindung mit Hochverfügbarkeit

Datensicherheit durch RAID6

Integrierte Daten Unverwundbarkeits Architektur mit

einer mehrstufigen Datenverifizierung

Page 30: Data Domain Backup & Recovery

30© Copyright 2009 EMC Corporation. All rights reserved.

Archivierung von NAS Daten

Clients

ApplikationenCIFS / NFS

– Einsparpotiential von bis zu 80%

– Verlängerung der Lebenszeit der Primärspeichersysteme durch Auslagerung der Daten auf hoch effiziente Data Domain Systeme

Page 31: Data Domain Backup & Recovery

31© Copyright 2009 EMC Corporation. All rights reserved.

Enterprise Manager GUI

Page 32: Data Domain Backup & Recovery

32© Copyright 2009 EMC Corporation. All rights reserved.

Enterprise Manager GUI

Page 33: Data Domain Backup & Recovery

33© Copyright 2009 EMC Corporation. All rights reserved.

Replication Monitoring

Page 34: Data Domain Backup & Recovery

34© Copyright 2009 EMC Corporation. All rights reserved.

Kundenbeispiele File+Oracle Sicherungenauf Data Domain – die ersten 3 Wochen

Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp

(GiB) (GiB) Factor Factor Factor (Reduction %)

--------------- -------- --------- ----------- ---------- -------------

Currently Used: 258311.3 26808.9 - - 9.4x (89.4)

Written:*

Last 7 days 67010.7 4743.8 6.2x 2.3x 14.1x (92.9)

Last 24 hrs 10970.0 687.7 7.2x 2.2x 16.0x (93.7)

--------------- -------- --------- ----------- ---------- -------------

Beispiel auf 3 Wochen Retention: 14.11-

07.12.09

• 258TB gesichert - 27.3TB auf DD belegt• Overall Ergebnis 9.5x (89.4%)

• Last 7 Day Ergebnis 14.1x (92.9%)

• Last 24 h Ergebnis 12.3x (91.9%)

• Aus den höheren Last 7 days und last 24h

Werten lässt sich erkennen, dass das

tägliche Datenwachstum auf der Data

Domain immer geringer wird.

• Pre-Comp:

Backup Datenvolumen, welches vom Backup

Server geschrieben wurde und auf der

Maschine gespeichert ist.

• Post-Comp:

Datenmenge die nach Dedupe und

Compression auf den Platten gespeichert ist

• Comp Ratio:

Overall Datenreduktionsfaktor

Page 35: Data Domain Backup & Recovery

35© Copyright 2009 EMC Corporation. All rights reserved.

Kundenbeispiele File+Oracle Sicherungenauf Data Domain – Zeitraum >1 Jahr

Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp

(GiB) (GiB) Factor Factor Factor (Reduction %)

--------------- -------- --------- ----------- ---------- -------------

Currently Used: 735084.3 31090.5 - - 23.6x (95.8)

Written:*

Last 7 days 28745.7 1731.4 12.3x 1.3x 16.6x (94.0)

Last 24 hrs 1747.5 102.2 11.2x 1.5x 17.1x (94.2)

--------------- -------- --------- ----------- ---------- -------------

Beispiel auf >1 Jar Retention:

• 735TB gesichert – 31TB auf DD belegt• Overall Ergebnis 23.6x (95.8%)

•Der Einbruch in der Graphik zeigt das

Ausaltern der Backup die Ihre Retention

von 1 Jahr erreicht haben

• Pre-Comp:

Backup Datenvolumen, welches vom Backup

Server geschrieben wurde und auf der

Maschine gespeichert ist.

• Post-Comp:

Datenmenge die nach Dedupe und

Compression auf den Platten gespeichert ist

• Comp Ratio:

Overall Datenreduktionsfaktor

Page 36: Data Domain Backup & Recovery

36© Copyright 2009 EMC Corporation. All rights reserved.

Kundenbeispiel ... die ersten Tage

Dedupe ratio of production data

1st Full Backup:

3.4x (70.6%) data reduction

45TB data saved

=> 14.3TB used on Data Domain disk

Overall:

5.0x (80.0%) data reduction

77.8TB data saved

=> 15.6TB used on Data Domain disk

Subsequential Backups:

~20x (95%)

20.4TB data saved

=> 991GB used on Data Domain disk

Page 37: Data Domain Backup & Recovery

37© Copyright 2009 EMC Corporation. All rights reserved.

Kundenbeispiel Oracle DB’s mit ~10% Änderungsrate/ Tagauf Data Domain – Zeitraum 4 Wochen

113TB gesichert – 10.7TB auf DD belegt• Overall Ergebnis 10.5x (90.5%)

• Pre-Comp:

Backup Datenvolumen, welches vom Backup

Server geschrieben wurde und auf der

Maschine gespeichert ist.

• Post-Comp:

Datenmenge die nach Dedupe und

Compression auf den Platten gespeichert ist

• Comp Ratio:

Overall Datenreduktionsfaktor

Pre-Comp Post-Comp Global-Comp Local-Comp Total-Comp

(GiB) (GiB) Factor Factor Factor (Reduction %)

--------------- -------- --------- ----------- ---------- -------------

Currently Used: 112830.2 10701.6 - - 10.5x (90.5)

Written:

Last 7 days 43718.3 2745.6 5.4x 3.0x 15.9x (93.7)

Last 24 hrs 12197.0 815.3 4.6x 3.2x 15.0x (93.3)

--------------- -------- --------- ----------- ---------- -------------

Page 38: Data Domain Backup & Recovery

38© Copyright 2009 EMC Corporation. All rights reserved.

• Marktführer mit + 4.300 Kunden, + 12.000 installierter Systeme und 54% Marktanteil

(The Taneja Group, September 2008)

• Entwicklung & Einsatz der besten DDUP-Technologie (In-Line, CPU-basiert etc.)

• Datenreduktion von über 90% führt zu Verkürzung von Wiederherstellungs- zeiten durch

viel längere Aufbewahrung der Backupläufe auf Platte

• Sicherestes und am Markt verfügbares DDUP–System

• Hohe Skalierbarkeit & Performance mit bis zu 12.8TB/hr

• Umsetzung „echter― DR-Konzepte

• Applikationsübergreifende

DeDuplizierung

• Real Green-IT: Drastische Reduktion der

Stromkosten, des Platzbedarfes

und der Klimakosten durch online DDUP

Zusammenfassend - Warum Data Domain ?

STORAGE MAGAZINE'S Products of the Year

Best Backup Hardware

Data Domain DD690

Deduplication

Storage System

http://searchstorage.techtarget.com/productsOfTheYear/0,294801,sid5_ayr2008,00.html

Page 39: Data Domain Backup & Recovery

39© Copyright 2009 EMC Corporation. All rights reserved.

DACH Kunden (Ausschnitt)