Zielgruppen
- Wissenschaftliche Forschung, Unternehmen, öffentliche Einrichtungen
Ihre Anforderungen
- Nutzung von High-Performance-Computing (HPC) Ressourcen
- Bedarf an GPU-basierten Systeme für Trainings- und Inferenzaufgaben
- Hochverfügbare Inferenzplattform
- Garantierte Time-to-completion
Unser Angebot
Für die Anwendungen und Dienste des KI-Servicezentrums wird ein GPU-basiertes HPC-System mit aktuellen NVIDIA A100 und H100 GPUs für Trainings- bzw. Inferenzaufgaben in Forschung, Entwicklung und Technik bereitgestellt. Die Rechenknoten sind über InfiniBand bzw. RoCE-Netzwerke untereinander und mit den ebenfalls angebotenen Speicherressourcen verbunden.
Das Inferenzsystem ist dabei georedundant an den Betreiberstandorten Leibniz Universität IT Services (LUIS) in Hannover und bei der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) installiert. Es verfügt über 9 bzw. 12 GPU-Knoten, die jeweils mit 4 NVIDIA H100 PCIe-GPUs (80 GB HBM2e-Speicher) ausgestattet sind.
Das Trainingssystem ist in Göttingen installiert und besteht aus 35 Knoten mit je 4 NVIDIA A100 SXM4-GPUs (80 GB HBM2e-Speicher). Die GPUs in jedem Knoten sind mit NVLINK und die Knoten untereinander sind mit einer InfiniBand HDR Fabric (2x 200 GBit/s pro Knoten) verbunden.
Software, Modelle und Daten können im Self-service installiert oder über die Kataloge des KISSKI eingebunden werden. Das System kann entweder im direkten Zugriff genutzt werden oder als technische Basis für die KISSKI-Services eingesetzt werden.