Künstliche Intelligenz (KI) hat das Potenzial, ganze Branchen und viele Aspekte unseres Lebens zu beeinflussen. Schon heute ist eines sicher: KI-Workloads werden zu den kritischsten Workloads gehören, die wir im Gesundheitswesen oder im Finanzwesen, aber auch in vielen anderen Bereichen einsetzen werden. Für Unternehmen stellt sich an dieser Stelle die Frage, wie sie diese sensiblen KI-Anwendungen ohne Ausfallzeiten am Laufen halten – und wie die zugrunde liegenden Daten gesichert werden können, ohne ihre Mobilität zu beeinträchtigen.
Daten und KI-Workloads einsatzbereit halten
Um Ausfallsicherheit und Schutz vor Datenverlusten und Ausfällen zu gewährleisten, setzen viele Unternehmen auf das bewährte Backup. Dies ist sinnvoll, um Daten auf breiter Ebene zu schützen. Für Business Continuity und Disaster Recovery sind Backups jedoch ungeeignet, insbesondere für die kritischsten Daten und Workloads – wie besagte kritische KI-Workloads. Backups haben die Schwäche, dass sie nur einzelne Server, nicht aber komplette Anwendungen schützen. Nach der Wiederherstellung von Daten aus einem Backup, müssen die Anwendungen zunächst manuell aus ihren einzelnen Komponenten wieder zusammengesetzt werden. Das kostet Zeit und ist verantwortlich für Wiederherstellungszeiten, die Tage oder sogar Wochen dauern können. Um die ständige Verfügbarkeit kritischer KI-Anwendungen zu gewährleisten, werden modernere Lösungen benötigt, die eine schnelle Wiederherstellbarkeit garantieren können. Immer mehr Unternehmen setzen auf DR-Lösungen für eine schnellere Wiederherstellung ihrer kritischsten Daten und Workloads. Derzeit ist CDP (Continuous Data Protection) die effektivste Wiederherstellungslösung. Mit CDP werden alle Datenänderungen während des Schreibvorgangs in einem Journal aufgezeichnet. CDP ermöglicht es somit, den Zustand, der nur wenige Sekunden vor einem Angriff oder einer anderen Störung bestand, in Sekundenschnelle und ohne größeren Datenverlust wiederherzustellen.
Kritische KI-Anwendungen benötigen die geringstmöglichen RPOs und RTOs
Um die geringstmöglichen RPOs und RTOs für diese kritischen KI-Anwendungen zu erreichen, bietet die „nahezu synchrone“ Replikation das Beste aus beiden Welten: die Leistungsvorteile der synchronen Replikation ohne die hohen Netzwerk- oder Infrastrukturanforderungen. Bei der „nahezu synchronen“ Replikation handelt es sich technisch gesehen um eine asynchrone Replikation. Diese funktioniert jedoch wie die synchrone Replikation, da die Daten gleichzeitig an mehrere Speicherorte geschrieben werden. Jedoch ist eine kleine Verzögerung zwischen dem primären und dem sekundären Speicherort möglich. Die „nahezu synchrone“ Replikation ist immer aktiv und repliziert ständig nur die geänderten Daten innerhalb von Sekunden an den Wiederherstellungsstandort. Da sie stets aktiv ist, muss sie nicht geplant werden, verwendet keine Snapshots, schreibt in den Quellspeicher und muss nicht auf die Bestätigung des Zielspeichers warten. Einer der Hauptvorteile der „nahezu synchronen“ Replikation besteht darin, dass sie ein hohes Maß an Datenverfügbarkeit und Datensicherheit bietet und gleichzeitig schnellere Schreibgeschwindigkeiten als die synchrone Replikation ermöglicht. Dies macht sie zu einer guten Wahl für Workloads wie kritische KI-Anwendungen mit hoher Schreiblast und/oder sehr großen Datenmengen.
Datenmobilität für KI-Daten fordert die IT-Infrastruktur heraus
KI basiert auf Daten. Der Umfang der KI-Daten ist eine völlig neue Ära der Datenerstellung. Umfang und Volumen sind exponentiell größer als alles, was die IT bisher gesehen hat. Selbst einfache Anwendungen verwenden Exabytes an Rohdaten, die für das Modelltraining und die anschließende Inferenz aufbereitet werden müssen. Die Datensätze werden oft vor Ort erstellt und müssen zur Verarbeitung in einen zentralen Datenspeicher übertragen werden. Am Ende des Lebenszyklus der KI-Daten müssen diese für ein mögliches erneutes Training archiviert werden. All dies stellt die IT-Infrastruktur und das Management vor neue Herausforderungen, da diese riesigen Datenmengen regelmäßig bewegt werden müssen. Eine traditionelle „Life & Shift“-Migration solcher Datenmengen sind mit den aktuellen Netzwerktechnologien und den auf synchroner Replikation basierenden Datenmanagementlösungen jedoch nicht möglich. Um KI-Daten auch bei begrenzter Verarbeitungsleistung und Bandbreite bewegen zu können, empfiehlt sich der Einsatz einer asynchronen Replikation. Nur so lässt sich eine kontinuierliche Replikation mit geringer Bandbreite auf Blockebene gewährleisten, die keine hohen Datenübertragungsspitzen erzeugt.
Fazit: KI braucht zukünftig CDP und nahezu synchrone Replikation
KI kann in Sekundenschnelle einen Musik-Track erstellen oder ein Bild im Stil van Goghs malen. Viele aktuelle und künftige KI-Anwendungen haben über solche trivialen Zwecke hinaus durchaus das Potenzial, das Leben der Menscheit insgesamt zu verbessern. KI wird uns schon bald dabei helfen, Krankheiten zu diagnostizieren, Krebszellen zu erkennen, Fahrzeuge autonom zu steuern, Verkehrsstaus zu lösen, mehrere Sprachen gleichzeitig zu übersetzen, unseren Energieverbrauch zu optimieren, Krankheiten von Pflanzen im Agrarsektor zu erkennen oder das Klima sowie die Luft- und Wasserqualität zu überwachen, um nur einige Anwendungsfälle zu nennen. Solche Anwendungen werden für die Menschheit von großer Bedeutung sein. Grund genug, um sie mit den bestmöglichen verfügbaren Lösungen zu schützen. Gleichzeitig stellt das Ausmaß der KI die derzeitige IT-Infrastruktur vor große Herausforderungen, wenn es um die Speicherung, Verwaltung und Übertragung der enormen Datenmengen geht. Aktuelle Technologien werden die erforderliche Datenmobilität für die riesigen KI-Datensätze nicht bereitstellen können. Um KI-Daten erfolgreich zu verwalten, braucht es neue Lösungen für deren Mobilität.
Der Autor
Kevin Cole ist Director Product and Technical Marketing für Data Protection bei Zerto. Zerto, ein Unternehmen von Hewlett Packard Enterprise, ermöglicht Kunden, einen „Always-on“-Betrieb, indem es den Schutz, die Wiederherstellung und die Mobilität von On-Premises- und Cloud-Anwendungen vereinfacht. Die Cloud-Datenmanagement- und -Schutzlösung von Zerto beseitigt die Risiken und die Komplexität der Modernisierung und Cloud-Einführung in Private-, Public- und Hybrid-Clouds. Die einfache, rein softwarebasierte Lösung nutzt kontinuierliche Datensicherung im großen Maßstab, um Ransomware-Resistenz, Disaster Recovery und Multi-Cloud-Mobilität zu gewährleisten. Mehr als 9.500 Kunden weltweit vertrauen auf Zerto, und mehr als 350 Managed-Service-Provider nutzen das Angebot.