Zielgruppen
- Wissenschaftliche Forschung, Unternehmen, öffentliche Einrichtungen
Ihre Anforderungen
- Nutzung von High-Performance-Computing (HPC) Ressourcen
- Bedarf an GPU-basierten Systeme für Inferenzaufgaben
- Niedrigschwelliger Zugang
- Hochverfügbare Inferenzplattform
- Garantierte Time-to-completion
Unser Angebot
Für die Anwendungen und Dienste des KI-Servicezentrums wird ein GPU-basiertes HPC-System mit aktuellen NVIDIA A100 und H100 GPUs für Inferenzaufgaben in Forschung, Entwicklung und Technik bereitgestellt. Die Rechenknoten sind über ein RoCE-Netzwerk untereinander und mit den ebenfalls angebotenen Speicherressourcen verbunden.
Die Inferenzplattform wird georedundant an den Betreiberstandorten Leibniz Universität IT Services (LUIS) in Hannover und bei der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) installiert.
Hardwareseitig verfügt sie über 9 bzw. 12 GPU-Knoten, die jeweils mit 4 NVIDIA H100 PCIe-GPUs (80 GB HBM2e-Speicher) ausgestattet sind.
Auf Softwareebene wird der Betrieb mit Slurm und Kubernetes realisiert. Die Datenbestände werden zwischen den Standorten synchronisiert. Software, Modelle und Daten können im Self-service installiert oder über die Kataloge des KISSKI eingebunden werden.
Das System kann entweder im direkten Zugriff per Batchsystem genutzt werden oder als technische Basis für die KISSKI-Services eingesetzt werden.
Nutzungsvoraussetzungen
Für die direkte Nutzung der Inferenzplattform wird ein aktueller SSH-Client benötigt.
Für die indirekte Nutzung der Rechenressourcen durch die am KISSKI angebotenen Dienste gelten individuelle Voraussetzungen.
Neue Dienste können auf Basis von Kubernetes aufgesetzt werden.