Nemotron 3 Ultra: Nvidias neues KI-Modell fünfmal schneller

Nvidia stellt auf der GTC Taipei ein umfassendes Open-Source-Toolkit für KI-Agenten vor und kündigt das leistungsstarke Sprachmodell Nemotron 3 Ultra an.

Die Software soll Unternehmen ermöglichen, langlebige, autonome digitale Assistenten zu entwickeln, die komplexe Aufgaben eigenständig orchestrieren können.

Anzeige

Während Nvidia die technischen Werkzeuge für KI-Agenten liefert, schafft der Gesetzgeber die nötigen Rahmenbedingungen. Dieser kostenlose Leitfaden hilft Unternehmen dabei, die Anforderungen der EU-KI-Verordnung an Risikodokumentation und Qualitätssicherung rechtzeitig umzusetzen. EU AI Act in 5 Schritten verstehen: Fristen, Pflichten und Risikoklassen kompakt erklärt

Neue Werkzeuge für Orchestrierung und Sicherheit

Im Zentrum der Ankündigung steht das Nvidia Agent Toolkit. Es enthält mehrere Komponenten, die standardisieren sollen, wie KI-Agenten mit Softwareumgebungen interagieren. Das Tool NemoClaw übernimmt dabei die zentrale Orchestrierung und steuert Aufgaben zwischen verschiedenen Modellen und Anwendungen.

Für die sichere Ausführung bringt Nvidia OpenShell in eine frühe Vorschauphase. Diese Laufzeitumgebung schafft eine geschützte Ebene unterhalb der Agentenschicht und soll Datenintegrität und Sicherheit gewährleisten.

Die CUDA-X-Bibliotheken stellt Nvidia künftig als sogenannte „Skills“ bereit – spezialisierte Fähigkeiten, die KI-Agenten bei Bedarf abrufen können. Zudem veröffentlichte das Unternehmen Baupläne für typische Unternehmensanwendungen wie KI-gestützte Suche (AI-Q) und Retrieval-Augmented Generation (RAG).

Nemotron 3 Ultra: Leistungssprung angekündigt

Ein weiteres Highlight ist das Sprachmodell Nemotron 3 Ultra mit 550 Milliarden Parametern. Es nutzt eine hybride Architektur aus Mamba-2 und Transformer Mixture-of-Experts (MoE) und kommt mit 55 Milliarden aktiven Parametern aus.

Die technischen Daten versprechen eine fünfmal schnellere Inferenz und 30 Prozent niedrigere Betriebskosten im Vergleich zu Vorgängermodellen. Der offizielle Launch ist für den 4. Juni 2026 geplant. Das Modell wird unter anderem über Hugging Face verfügbar sein.

Erste Benchmarks deuten darauf hin, dass Nemotron 3 Ultra mehrere aktuelle Open-Source-Konkurrenten in Geschwindigkeit und Kontextfenster-Kapazität übertrifft.

Anzeige

Der technologische Fortschritt durch neue KI-Modelle bringt auch neue Herausforderungen für die IT-Sicherheit in Unternehmen mit sich. In diesem kostenlosen E-Book erfahren Unternehmer, wie sie Sicherheitslücken schließen und gleichzeitig die aktuellen gesetzlichen Anforderungen an den Datenschutz erfüllen. IT-Sicherheit stärken ohne teure Investitionen: So schützen clevere Unternehmer ihre Firma vor Cyberangriffen

Nächste Hardware-Generation in Produktion

Nvidia bestätigte, dass die Vera-Rubin-Plattform und die Vera-CPU bereits in der Produktion sind. Die Vera-CPU soll für KI-Agenten-Workloads die 1,8-fache Leistung standardmäßiger x86-Prozessoren bieten.

Die Massenproduktion der Vera-Rubin-Plattform verspricht deutliche Effizienzgewinne gegenüber der Vorgängerarchitektur Grace Blackwell. Die Auslieferungen beginnen im Herbst 2026.

Zu den ersten Kunden zählen Branchengrößen wie OpenAI, Anthropic, SpaceXAI, ByteDance und CoreWeave. Mit dem neuen Betriebssystem DSX und der MaxLPS-Technologie können Rechenzentren zudem bis zu 40 Prozent mehr GPUs bei gleicher Stromversorgung betreiben.

Physische KI und Edge-Computing

Nvidia erweitert sein Agenten-Framework auch auf den Bereich Physical AI – also Robotik und autonome Fahrzeuge. Die Plattformen Cosmos, Omniverse, Isaac und Metropolis erhalten Updates für agentenbasierte Arbeitsabläufe.

Bereits am 1. Juni erschien JetPack 7.2 für die Jetson-Edge-Plattform. Das Update ermöglicht die Ein-Klick-Bereitstellung von NemoClaw auf Edge-Geräten und verbessert die Leistung des Jetson AGX Orin 32GB auf 241 TOPS.

Robotik-Partner wie Agile Robots, 1X und Agility nutzen die Werkzeuge bereits für humanoide Referenzdesigns und industrielle Automatisierung.

Breite Partnerschaften in der Industrie

Nvidias Vorstoß in Richtung agentenbasierter KI wird von einem breiten Bündnis aus Software- und Industriepartnern gestützt. Microsoft, SAP, ServiceNow, Palantir und CrowdStrike integrieren das Toolkit in ihre KI-Angebote.

Im Industriesektor setzen Siemens, Dassault Systèmes, Cadence und Synopsys auf die Agent-Toolbox, um komplexe Engineering- und Designprozesse zu automatisieren. Auch Fertigungspartner wie Foxconn, TSMC, Pegatron und Delta sind dem Ökosystem beigetreten, um autonome Werkzeuge in der Produktion und Lieferkettenverwaltung einzusetzen.