Leute! Dedupe ist nicht Copy Data Management!

Wenn man heute jemandem aus der IT – insbesondere im Backup- und Recovery-Umfeld – die Grundsätze des Copy Data Management (CDM) erklärt, gibt es eine oftmals ähnliche  Reaktion: „Ich habe bereits CDM, da ich Dedupe verwende„.  Diese Reaktion ist nicht sonderlich verwunderlich, da beispielsweise auch der Dedupe Appliance-Marktführer  gerne Branchenbegriffe verwendet und sie in eine Form biegt, die zu ihren eigenen Angeboten passen.  Eine ähnlich „angepasste“ Perspektive wird auch von allen anderen Anbietern mit Deduplizierung in ihren Geräten, Software, Speicher-Arrays usw. propagiert.

Das bedeutet keineswegs, dass Deduplizierung keine sinnvolle und vor allem nützliche Technologie ist. Deduplizierung ist eine sehr effiziente Methode zur Datenreduktion und wurde als angemessene Antwort auf das Problem, dass die Sicherungs-Volumina mehr und mehr außer Kontrolle gerieten, entwickelt. Vor allem wegen wachsender Produktionsgröße und häufiger Voll-Backups mit längeren Aufbewahrungsfristen sind die Sicherungs-Volumina geradezu explodiert. Wenn man umfangreiche, vollständige Backups mit ca. 5%-10% Änderungsrate auf einer Deduplizierungs-Appliance sichert erzielt man traumhafte Deduplikationsraten.

Aber mal ehrlich:

Warum um alles in der Welt sollte man 100% der Daten vom Produktions-Storage Tag für Tag, Woche für Woche lesen um dann 90-95% der gelesenen Daten zu wiederum zu verwerfen?

Das einzige Ziel bei der Datensicherung ist doch, eine erfolgreiche Wiederherstellung zu gewährleisten.  Im Idealfall ist die Wiederherstellung zeitnah. Und genauso ist im Idealfall eine ebenso effiziente und zuverlässige Wiederherstellung von Daten, die über einen längeren Zeitraum (Monate, Jahre und sogar Jahrzehnte) aufbewahrt wurden, wünschenswert.

Was wäre wenn man die Wiederherstellung kurzfristig, selbst im Fall mehrer TB,  sicherstellen könnte, ohne all diese belastende und aufwändige Datenverschiebung?

Und deshalb ist Deduplizierung kein Copy Data Management

Eine Deduplizierung ist lediglich ein “dummes” Repository mit einer hohen Speicher-Effizienz. Die Deduplizierung kennt weder einen Bezug zur Applikation die die Daten erstellt hat (Applikationskonsistenz) noch unterscheidet sie Datentyp oder Art des Applikationsbetriebs (Produktion, Analytik, Dev/Test, etc.).

Im Gegensatz dazu ist echtes Enterprise Copy Data Management anwendungsorientiert und nativ integriert, um eine möglichst effiziente Erfassung dieser Anwendungsdaten und deren Veränderung zu gewährleisten.  Copy Data Management befasst sich mit dem vorgelagerten Problem der zu viele redundanten Kopien der Produktionsdaten und konsolidiert diese auf den kleinsten gemeinsamen Nenner. CDM verwaltet die Daten in ihrem nativen Format (Applikations-Format), so dass Sie sofort wieder auf diese Daten zugreifen und sie nutzen können.

Enterprise Copy Data Management ist Application Aware

Enterprise Copy Data Management ist Application Aware 

Echte Copy Data Management Lösungen, wie Actifio, sind infrastrukturunabhängig.  Auf die virtuellen Kopien von Actifio kann direkt im Applikationsformat zugegriffen werden. Der Speicher kann nahezu jeder belibiger blockbasiert und/oder objektbasierte Storage sein. Im Rechnzentrum und/oder in der Cloud.

Zur Realisierung von langfristigen Aufbewahrungszeiten schreibt auch Actifio speichereffizient in einen deduplizierten und komprimierten Pool.

actifio – Enterprise Copy Data Management