HPE Cray Supercomputing für generative KI kommt
Universitäten oder große Unternehmen brauchen für das Training von KI-Modellen enorme Compute-Power. HPE bringt dafür eine Supercomputer-Komplettlösung auf den Markt: Software-Suite für Training, Tuning und Entwicklung, flüssigkeitsgekühlte Supercomputer, KI-Beschleuniger, Netzwerke, Speicher und Dienstleistungen.
Ab Dezember dieses Jahres soll HPEs neue Supercomputer-Lösung für generative KI in rund 30 Ländern verfügbar sein. Sie soll das Training und Tuning von KI-Modellen auf Basis privater Datensätze beschleunigt. Darauf setzen aktuell Forschungseinrichtungen sowie große Unternehmen und Behörden. Diese Zielgruppe hat PE mit seinem Komplettpaket im Auge.
Dazu gehört die Software-Suite mit der Supercomputer-Technologie von HPE Cray. Sie basiere laut Hersteller auf der gleichen Architektur wie der schnellste Supercomputer der Welt. Dieser wird von Nvidia Grace Hopper GH200-Superchips angetrieben und bewältigt große Workloads bei Trainings von großen Sprachmodellen (LLM) und Deep-Learning-Empfehlungsmodellen (DLRM).
Mit dem HPE Machine Learning Development Environment auf diesem System wurde laut Hersteller das Open-Source-Modell Llama 2 mit 70 Milliarden Parametern in weniger als 3 Minuten feinabgestimmt, womit HPEs Supercomputing-Lösung für eine 2-3-fache Leistungsverbesserung stehe, so der Hersteller.
HPEs neue Supercomputer-Lösung für generative KI umfasst laut Hersteller folgende Bausteine:
- KI/ML-Beschleunigungssoftware: eine Suite von drei Software-Werkzeugen, mit denen Kunden KI-Modelle trainieren, tunen und eigene KI-Anwendungen erstellen können,
- HPE Machine Learning Development Environment: eine Softwareplattform für maschinelles Lernen (ML), die die Entwicklung und Einführung von KI-Modellen beschleunigt. Sie umfasst gängige ML-Frameworks und vereinfacht die Datenaufbereitung,
- Nvidia AI Enterprise: umfangreiche Frameworks, vortrainierte Modelle und Werkzeuge, die die Entwicklung und Bereitstellung von Produktions-KI vereinfachen,
- HPE Cray Programming Environment: kompletter Werkzeug-Satz für die Entwicklung, Portierung, Fehlersuche und Verfeinerung von Code,
- HPE Cray EX2500: ein System der Exascale-Klasse, dass in der Lage sein soll, auf Tausenden von Grafikprozessoren skaliert werden, um große KI-Workloads zu unterstützen. Es handele sich um das erste System mit der Vierfach-GPU-Konfiguration des GH200 Superchips, so HPE,
- HPE Slingshot Interconnect: offenes, Ethernet-basiertes Hochleistungsnetzwerk zur Unterstützung von Workloads der Exascale-Klasse,
- HPE Complete Care Services für Einrichtung, Installation und laufende Wartung.
Experten-Schätzungen zufolge werde das Wachstum von KI-Workloads bis 2028 etwa 20 Gigawatt Strom in Rechenzentren erfordern, schreibt HPE. "Um die Auswirkungen ihres CO2-Fußabdrucks zu minimieren, werden Kunden energieeffizientere Lösungen benötigen". Die in der neuen Komplettlösung von HPE eingesetzten Supercomputer seien flüssigkeitsgekühlt und böten damit bis zu 20 Prozent mehr Leistung pro Kilowatt als luftgekühlte Systeme und verbrauchten 15 Prozent weniger Strom. Sechs der zehn energieeffizientesten Supercomputer auf der Green500-Liste seien von HPE gebaut worden, untermauert der Hersteller seine Ambitionen beim Ressourcenschutz.