NVIDIA und Dell treiben agentische KI mit Vera Rubin NVL72 voran | KIBOTI Magazin

NVIDIA CEO Jensen Huang bei Dell Technologies World: „Demand Is Going Parabolic, Utterly Parabolic“

NVIDIA und Dell Technologies haben auf der Dell Technologies World ihre Partnerschaft deutlich erweitert und neue Produkte vorgestellt, die auf die Skalierung agentischer KI in Unternehmen abzielen.

Jensen Huang, CEO von NVIDIA, beschrieb die aktuelle Nachfrage nach KI als „parabolisch, absolut parabolisch“. Die Zusammenarbeit konzentriert sich auf On-Premises-Bereitstellung, Inferenz im großen Maßstab und sichere agentische Systeme.

Neue Hardware-Plattformen

Im Mittelpunkt steht die NVIDIA Vera Rubin NVL72, eine Rack-Scale-Plattform mit 72 Rubin GPUs und 36 Vera CPUs. Sie integriert hohe Inferenzleistung, schnellen Speicher und erhebliche Bandbreite in einem einzelnen Rack. Die Plattform soll die Kosten pro Token für agentische KI-Inferenz erheblich senken und deutlich höhere Durchsatzleistung pro Watt im Vergleich zur Blackwell-Generation bieten.

Die Rubin GPU basiert auf dem TSMC 3nm-Prozess, verfügt über 336 Milliarden Transistoren und 288 GB HBM4-Speicher. NVIDIA stellte zudem die Vera CPU vor – die erste eigenständige Rechenzentrums-CPU des Unternehmens mit 88 Arm-basierten Olympus-Kernen.

Dell AI Factory mit NVIDIA

Dell kündigte mehrere neue Systeme an, darunter den PowerEdge XE9812 auf Basis der Vera Rubin NVL72 sowie die Modelle XE9880L, XE9885L und XE9882L mit HGX Rubin NVL8. Das Portfolio wird durch das PowerSwitch-System mit NVIDIA Quantum-X800 InfiniBand und Spectrum-6 Ethernet sowie integrierte PowerRack-Lösungen ergänzt.

Zusätzlich bringen die PowerEdge M9822 und R9822 Server die neuen Vera CPUs in Unternehmensumgebungen. Die PowerCool CDU C7000 adressiert die Kühlungsanforderungen der Hochleistungsplattformen.

Fokus auf On-Premises und Sicherheit

Die Partner setzen stark auf vertrauliches Computing. NVIDIA Confidential Computing soll die sichere Ausführung von Frontier-Modellen On-Premises ermöglichen, ohne sensible Modell- oder Unternehmensdaten preiszugeben. Dies wird mit Partnern wie Fortanix, Google und Red Hat umgesetzt.

Offene Modelle und Software-Ökosystem

NVIDIA stellt die Nemotron-Modellfamilie mit offenen Gewichten vor, darunter Varianten mit hybrider Mamba-Transformer-MoE-Architektur und nativem 1M-Token-Kontextfenster. Weitere offene Modelle verschiedener Anbieter werden über den Dell Enterprise Hub verfügbar gemacht.

Zusätzlich wurden NVIDIA OpenShell und der NemoClaw Stack angekündigt – Open-Source-Komponenten für die sichere Ausführung autonomer Agenten in Sandbox-Umgebungen.

Quelle: NVIDIA Blog

FAQ

Welche Leistungssteigerung verspricht die Vera Rubin NVL72 gegenüber Blackwell? NVIDIA gibt an, dass die Plattform eine bis zu zehnmal höhere Durchsatzleistung pro Watt sowie eine erhebliche Reduktion der Kosten pro Token für agentische Inferenz ermöglichen soll.

Was ist die NVIDIA Vera CPU? Es handelt sich um NVIDIAs erste eigenständige Rechenzentrums-CPU mit 88 Arm-basierten Olympus-Kernen (Armv9.2), die speziell für agentische Workloads und SQL-Analysen optimiert wurde.

Welchen Schwerpunkt hat die erweiterte NVIDIA-Dell-Partnerschaft? Der Fokus liegt auf der sicheren, On-Premises-Bereitstellung agentischer KI in großem Maßstab unter Verwendung von Confidential Computing und offenen Modellen für Unternehmen.

Veröffentlicht am

Neue Hardware-Plattformen

Dell AI Factory mit NVIDIA

Fokus auf On-Premises und Sicherheit

Offene Modelle und Software-Ökosystem

FAQ

Wie geht es weiter?