Suche
Sprachen

Datendeduplizierung und -komprimierung

Sparen Sie bares Geld – befreien Sie Speicherplatz von redundanten Daten

Unkontrolliertes Datenwachstum erschöpft sehr rasch die Speicherkapazität. Das führt dazu, dass IT-Teams immer neue Hardware hinzufügen müssen, was mit unnötigem Kosten- und Personalaufwand verbunden ist. Doppelte Datensätze tragen erheblich zu diesem Problem bei. Gleiches gilt für Datensätze, die eigentlich komprimiert werden könnten, aber in ihrer Originalgröße kostbaren Festplattenplatz belegen. Eine effektive Optimierung der Speicherkapazität kann dazu beitragen, diese Herausforderungen zu bewältigen.

DataCore SANsymphony software-defined storage offers two data reduction techniques for capacity optimization. Storage deduplication eliminates redundant data. Compression condenses the space required to store data. Both techniques prevent data loss to always maintain data integrity.

Was ist Deduplizierung und Komprimierung eigentlich?

DeduplizierungBei der Deduplizierung werden Datenblöcke analysiert und jeweils mit einem eindeutigen Hash versehen. Wenn ein neu auf die Festplatte geschriebener Block den gleichen Hash-Wert wie ein bereits vorhandener Block hat, wird er durch eine Kennung ersetzt, die einfach auf den bereits vorhandenen Block verweist.

Mehrere redundante Datenkopien können durch Verweise auf eine einzelne Kopie ersetzt werden, sodass sich der Kapazitätsbedarf verringert.

Deduplizierung ist besonders dann von Vorteil, wenn es mehrere Blöcke mit gleichen Daten gibt, z. B. Redundanz innerhalb von Snapshots oder VDI-Bildern.

DeduplizierungKomprimierung ist ein Algorithmusvorgang, bei dem die Datengröße verringert wird. Dazu werden zuerst identische Datensequenzen in einer Reihe gesucht, von denen nur die erste Sequenz gespeichert wird. Die folgenden, identischen Sequenzen werden durch die Information ersetzt, wie häufig sie in der Reihe erscheinen.

Da nur die erste Datensequenz so gespeichert wird, wie sie tatsächlich ist, kommt man mit weniger Platz aus, um die gleichen Informationen darzustellen. Die Komprimierungsmethode hängt in der Regel von der Art des Datensatzes ab, d. h. davon, ob es sich um ein komprimierbares Format handelt und wie viel davon komprimiert werden kann.

Vorteile von Deduplizierung und Komprimierung

  • Geringerer Speicherplatzbedarf und optimale Speicherzuweisung
  • Größere IT-Kosteneinsparungen und höherer ROI
  • Geringere Hardware-Standfläche und dadurch weniger Platz- und Energiebedarf
  • Bessere Speichereffizienz

Zwei Ansätze für die Datendeduplizierung und -komprimierung

SANsymphony von DataCore bietet zwei Methoden für die Speicherdeduplizierung und -komprimierung. Wählen Sie den passenden Ansatz entsprechend Ihren Geschäfts- und IT-Anforderungen.

Inline-Deduplizierung und -Komprimierung: Hier erfolgt die Verringerung der Daten, bevor diese auf die Festplatte geschrieben werden. SANsymphony überprüft und analysiert die eingehenden Daten auf Optimierungsmöglichkeiten und führt dann die Deduplizierung und Komprimierung durch. Bei der Inline-Komprimierung verringert sich die beanspruchte Kapazität, da die Daten vor der Speicherung dedupliziert und komprimiert werden. Werden häufige Backups geschrieben, bei denen die Menge der generierten redundanten Daten hoch ist, empfiehlt sich die Inline-Verarbeitung, da sie die Datengröße verringert, bevor das Backup gespeichert wird.

Inline-Deduplizierung und -Komprimierung werden nur von der EN-Edition von SANsymphony unterstützt und können nach Bedarf einzeln oder gemeinsam aktiviert werden (d. h. entweder Deduplizierung oder Komprimierung oder beides).

Post-Process-Deduplizierung und -Komprimierung: Hier erfolgt die Verringerung der Daten, nachdem diese auf die Festplatte geschrieben wurden. SANsymphony speichert zunächst die Rohdaten im Zielspeichermedium. Anschließend werden die gespeicherten Daten auf Optimierungsmöglichkeiten überprüft und analysiert. Die deduplizierten und komprimierten Daten werden wieder auf das Speichermedium geschrieben, beanspruchen nun aber weniger Kapazität. Es ist zu beachten, dass die anfängliche Kapazitätszuweisung auf dem Zielmedium beim Post-Processing größer ist, da zunächst Rohdaten gespeichert und erst dann reduziert werden. Post-Processing ermöglicht es, die Kapazitätsoptimierung außerhalb der Spitzenzeiten zu legen, um die IOPS-Auswirkungen im Betrieb zu verringern.

Post-Process-Deduplizierung und -Komprimierung werden von den EN-, ST- und LS-Editionen von SANsymphony unterstützt. Vergleich der SANsymphony-Editionen.

Infografik „Inline- und Post-Process-Datendeduplizierung und -komprimierung“

Inline- und Post-Process-Datendeduplizierung und -komprimierung mit SANsymphony im Vergleich

Es gibt viele Faktoren, die für Effizienz und Output der Deduplizierung und Komprimierung eine Rolle spielen: der Datentyp, die Änderungsrate der Daten, die Zugriffshäufigkeit, die Backup-Häufigkeit und so weiter. Es gibt Arbeitslasten, die die Redundanz auf Anwendungsebene selbst zu einem gewissen Grad eliminieren, sodass sie nur ein geringeres Deduplizierungs- und Komprimierungsverhältnis erreichen. Andere Arbeitslasten wie beispielsweise VDI mit mehreren Kopien desselben Betriebssystembilds erreichen wiederum ein höheres Deduplizierungs- und Komprimierungsverhältnis. Die Dateitypen, die am stärksten von Deduplizierung und Komprimierung profitieren, sind solche mit repetitiven Datenblöcken, solche mit relativ statischem Inhalt und solche, die selten abgerufen werden. Mit beiden Methoden zur Kapazitätsoptimierung – Inline und Post-Processing – können IT-Abteilungen Investitionskosten einsparen. Die tatsächlichen Einsparungen hängen von der Effizienz der Deduplizierungs- und Komprimierungsvorgänge und dem jeweiligen Kapazitätsoptimierungsverhältnis ab.

Erste Schritte mit SANsymphony, Software-Defined Blockspeicher