« Alle Blog Einträge

Einführung in Ceph Storage

Bei Ceph handelt es sich um eine Speicherlösung, die mehrere vernetzte Rechner nutzt. Aufgrund der Open-Source-Programmierung, der hohen Skalierbarkeit und großen Ausfallsicherheit stellt sie eine attraktive Option für Anwender dar. Wir zeigen Ihnen in dieser Einführung die Stärken und Schwächen des Programms sowie Lösungen, mit denen Sie selbst ohne eigenes Ceph-Netzwerk von den Vorteilen des Programms profitieren können. 

Ceph Storage – Die umfassende Speicherlösung

Die Grundlage zu Ceph wurde von Sage A. als Teil seiner Dissertation geschaffen, der das Programm später mit seinem eigenen Unternehmen vorantrieb und weiterentwickelte. Nachdem sein Unternehmen Inktank Storage von RedHat übernommen wurde, arbeitet er dennoch weiterhin als Chefentwickler an Ceph. 

Das 2012 erschienene Programm steht für hohe Flexibilität und Kompatibilität mit den Speichergeräten Ihrer Wahl, aber auch für schnelle Skalierbarkeit Ihres Speichers. Ceph eignet sich insbesondere für die mehrfache Speicherung essentieller Daten auf verschiedenen Speichermedien und die Distribution der Daten an unterschiedlichen Speicherorten innerhalb Ihres Netzwerks. 

Man unterscheidet zwischen drei verschiedenen Arten von Speichern, die Ceph ermöglicht. Das ist einmal der Objektspeicher, der mit Swift und S3-API kompatibel ist, zweitens virtuelle Blockgeräte und zuletzt das verteilte Dateisystem CephFS.

Aufgrund der Redundanz ist Ceph selbstheilend und bietet Anwendern eine hohe Ausfallsicherheit. Die Daten werden jeweils in mehrfachen Ausführungen gespeichert und über ein Netzwerk verteilt, sodass der Ausfall einzelner Komponenten kompensiert werden kann. 

Ceph Storage Cluster – Ein Netzwerk aus Nodes

Ein Cluster in Ceph besteht aus mehreren Nodes. Ein Node entspricht dabei einem Rechner innerhalb des Netzwerkes. Innerhalb eines Ceph Clusters existieren verschiedene Rollen. Die Überwachung und Verwaltung liegt bei den Monitoring-Nodes, während die Object Storage Nodes oder auch Object Storage Devices den Speicher bilden. 

Des weiteren existieren zusätzlich noch Manager Nodes sowie Metadatenserver. Die Nodes in einem Ceph Cluster erfüllen also jeweils eine von vier verschiedenen Rollen. In einem Cluster liegen sie in unterschiedlicher Anzahl in Bezug auf ihre Rollen vor. Üblicherweise ist dabei die Anzahl der Monitoring Nodes ungerade und es befindet sich mindestens die Hälfte von ihnen in Betrieb. 

RADOS – Das Herzstück von CEPH

Die Abkürzung RADOS steht für Reliable Autonomic Distributed Object Store. Der Name weist gleich auf mehrere Eigenschaften von Ceph hin. Reliable steht in dem Fall für die Zuverlässigkeit auch bei Ausfällen von Teilkomponenten sowie der integrierten Redundanz, die Ihre Daten sichert. Autonomic weist auf die Tatsache hin, dass dank des Algorithmus die Speicherorte autonom nach benutzerspezifischen Kriterien gewählt werden. Object schließlich sagt, dass Daten in Ceph als Objekte gespeichert werden.

Pseudozufällige Datenablage – Der CRUSH-Algorithmus

Eine Stärke von Ceph Storage ist zweifellos der CRUSH-Algorithmus, der automatisch den optimalen Speicherort für eine Datei auswählt. Auch wenn es den Anschein erweckt, rein auf Zufall zu basieren, berechnet Ceph in Wirklichkeit nach spezifizierten Kriterien die beste Speichermöglichkeit. Diese Kriterien können vom Netzwerk-Administrator im Vorfeld festgelegt werden. In diesem Speicherschritt werden die Dateien ebenfalls vervielfältigt und physisch voneinander getrennt gespeichert.

Zudem werden die Daten bis zu ihrer endgültigen Ablage in einem Journaling zwischengespeichert, sodass sie auch in diesem Zustand abgesichert sind. Jeder Node innerhalb eines Clusters, aber auch jeder Client ist in der Lage, den aktuellen Ablageort einer Datei zu berechnen. 

Ceph skaliert in die Breite, nicht in die Höhe

Aufgrund seiner Skalierbarkeit eignet sich Ceph Storage für Unternehmen verschiedener Größen. Um den Speicherplatz zu erweitern, muss lediglich ein neuer Node hinzugefügt werden. Die Skalierbarkeit reicht bis zu tausenden von Servern im Petabytebereich.  Anstelle klassisch in die Höhe zu skalieren, indem vorhandene Knotenpunkte aufgerüstet werden, gelingt mit Ceph die Skalierung in die Breite. 

Aber kleinere Unternehmen können ebenfalls von Ceph profitieren. Sei es mit der Einrichtung eines kleinen Ceph Clusters oder durch die Nutzung von Managed Storage Services auf Ceph-Basis. In diesem Fall müssen Sie sich um Wartung und Installation keine Gedanken machen, das erledigen wir für Sie. Sie nutzen lediglich die Vorteile von Ceph Storage und können Ihre Daten gut abgesichert wissen. 

Ceph Storage – Installation in heterogene Netzwerke

Auch in heterogenen Netzwerken, also solchen, in denen neben Linux noch weitere Betriebssysteme verwendet werden, performed Ceph sehr gut und bietet zahlreiche Schnittstellen an. Dies erlaubt eine einfache Installation in ein Netzwerk sowie die problemlose Integration neuer Nodes. Aufgrund seiner Open-Source-Software funktioniert Ceph unabhängig von bestimmter Hardware oder besonderen Anbietern, sodass Sie nicht unbedingt in neue Hardware oder in ein neues Netzwerk investieren müssen. 

Ceph kommt Nutzern bei der Installation auch noch auf andere Weise entgegen. Alle Kernkomponenten sind in einer einzelnen Setup-Datei gebündelt und erlauben es, ein neues Cluster recht schnell aufzusetzen. 

Maximale Sicherheit für Ihre Daten

Durch die im Algorithmus integrierte Redundanz ist jede gespeicherte Datei mehrfach im Netzwerk vorhanden. Die genaue Anzahl der Kopien können dabei vom Nutzer selbst festgelegt werden. 

Wenn Nodes wegfallen oder entfernt werden, stellt dies aufgrund der dezentralen Organisation von Ceph kein Problem dar. So können Komponenten einfach ausgetauscht oder aus dem Netzwerk genommen werden. Dies bietet auch Vorteile für den Fall eines Ausfalls. Das Cluster kann die Daten automatisch neu verteilen und ist selbstheilend, sodass in Kürze alle Dateien wieder in gewünschter Anzahl reproduziert sind.

Die Nachteile von Ceph Storage

Obwohl die Zuteilung von Speicherorten autonom erfolgt und somit wenig arbeitsintensiv ist, kann die Einrichtung und Konfiguration von Ceph sowie des CRUSH-Algorithmus einiges an Aufwand in Anspruch nehmen. 

Auch die Skalierbarkeit ist zwar eine deutliche Stärke des Programms, wird aber nicht von jedem Unternehmen benötigt. Aufgrund der verschiedenen Rollen der einzelnen Nodes besteht eine gewisse Mindestgröße für ein Netzwerk. In dem Fall würde sich eher eine Managed Storage Lösung eignen. 

Managed Ceph Storage mit servinga

Bei servinga bieten wir auch Storage-as-a-Service auf der Basis von Ceph an. Dabei nutzen wir unser Ceph Cluster, um Ihre Daten abzusichern und Ihnen Speicherplatz bereitzustellen. Sie selbst benötigen dabei nicht zwingend Ceph oder das Betriebssystem Linux, da wir verschiedene Interfaces anbieten, beispielsweise für Windows. 

Da der Aufwand für die Aufsetzung eines Netzwerkes nicht immer gerechtfertigt ist, stellen Managed Storage Lösungen in diesen Fällen eine gute Alternative dar. Wir beraten Sie gerne, welche Lösung sich für Sie am besten eignet. 

Fazit

Ceph Storage bietet mit seiner Skalierbarkeit und Flexibilität viele Vorteile für umfangreiche Netzwerke. Als Managed Storage Service eignet es sich auch sehr gut für kleinere Unternehmen. Die etwas aufwendigere Installation wird durch den starken Algorithmus mehr als ausgeglichen und dank der Redundanz und der dezentralen Verwaltung ist sind Ihre Daten im Ceph Cluster bestens vor Ausfällen geschützt.