NVIDIA fused MLP-Kernel: KI-Training bis 2,1x schneller

Der US-Chipkonzern NVIDIA hat Mitte Juni 2026 mehrere milliardenschwere Partnerschaften in Asien und Ozeanien geschlossen und zugleich bedeutende Software-Optimierungen für das KI-Training vorgestellt. Die Entwicklungen umfassen deutliche Leistungssteigerungen für bestimmte KI-Modellarchitekturen sowie den Ausbau der sogenannten AI Factory-Initiative durch Allianzen in Südkorea, Kasachstan und Australien.

Leistungssprung für spezielle KI-Modelle

Am 15. Juni 2026 brachte NVIDIA neue sogenannte fused MLP-Kernel auf den Markt, die speziell für Mixture-of-Experts-Modelle (MoE) entwickelt wurden. Diese Bausteine, programmiert mit der domänenspezifischen Sprache CuTe, zielen auf typische Engpässe beim KI-Training ab – etwa Speicherüberlastung und die Synchronisation zwischen CPU und GPU. Ersten Benchmarks zufolge erreichen die Kernel auf dieser Ebene eine Beschleunigung zwischen dem 1,3- und 2,1-Fachen.

Anzeige: Die neuen fused MLP-Kernel von NVIDIA beschleunigen KI-Training um bis zu 2,1x – speziell für MoE-Modelle. Erfahren Sie in diesem kostenlosen Report, wie Sie die Kernel in Ihre Pipeline integrieren und von synchronisationsfreier Ausführung profitieren. Jetzt Benchmark-Report anfordern

Die tatsächlichen Durchsatzsteigerungen hängen stark von der jeweiligen Modellarchitektur ab. Laut technischer Dokumentation ermöglichen die Kernel bei GPT-OSS-Modellen eine End-to-End-Steigerung von 93 Prozent, bei DeepSeek-V3 immerhin acht Prozent. Möglich werden diese Gewinne durch eine synchronisationsfreie MoE-Ausführung mittels CUDA Graphs. Die Software unterstützt mehrere Quantisierungsformate, darunter MXFP8 und NVFP4, und wird in das cuDNN Frontend (ab Version 1.23.0), den Transformer Engine und Megatron Core integriert.

Milliarden-Pakt mit südkoreanischen Konzernen

Bereits Anfang Juni schloss NVIDIA-CEO Jensen Huang während eines Besuchs in Seoul mehrere Technologieabkommen mit führenden südkoreanischen Industriekonzernen ab. Am 8. Juni 2026 bestätigte das Unternehmen eine mehrjährige Partnerschaft mit dem Speicherchiphersteller SK hynix. Sie betrifft fortschrittliche Speicherlösungen für künftige Hardware-Generationen, darunter die Architekturen Vera Rubin und Vera CPU. Huang bezeichnete SK hynix dabei als primären Speicherpartner.

Die Expansion in Südkorea umfasst mehrere Großprojekte:

SK Telecom: Der Telekommunikationsanbieter plant den Bau einer KI-Cloud im Gigawatt-Maßstab auf Basis der NVIDIA-DSX-Architektur. Das erste dedizierte KI-Rechenzentrum soll 2027 in Betrieb gehen.
LG Group: Gemeinsam entsteht eine AI Factory für physische KI und Robotik. LG setzt dabei auf NVIDIAs Isaac Sim und Isaac Lab zum Training humanoider Roboter und entwickelt 800-Volt-Gleichstromlösungen nach NVIDIA-Vorgaben.
NAVER: Der Internetkonzern baut seine KI-Infrastruktur mit der 55-Megawatt-Anlage GAK-Sejong aus, mit dem Ziel, ebenfalls Gigawatt-Kapazität zu erreichen.
Hyundai und Doosan: Die Kooperationen vertiefen die Zusammenarbeit in den Bereichen autonome Mobilität, KI-gesteuerte Fertigung und physische KI-Robotik.

AI Factory: Vom Chip zum Komplettsystem

NVIDIAs strategischer Wandel – weg vom reinen Chipverkauf hin zu integrierten AI Factory-Lösungen – zeigt sich besonders in zwei Großprojekten vom 15. Juni 2026.

Anzeige: Speicherengpässe und CPU-GPU-Synchronisation bremsen Ihr MoE-Training? NVIDIA’s fused MLP-Kernel lösen genau diese Probleme – mit bis zu 93% End-to-End-Beschleunigung bei GPT-OSS. Der Report zeigt Ihnen die konkreten Integrationsschritte. Optimierungs-Tipps jetzt sichern

Kasachstan: Das von NVIDIA unterstützte Unternehmen Firebird unterzeichnete eine Vereinbarung zur Entwicklung eines „Data Center Valley“ in Ekibastuz. Das Gesamtinvestitionsvolumen liegt bei umgerechnet rund 9,3 Milliarden Euro. In einer ersten Phase sind fünf Milliarden Euro vorgesehen, unterstützt durch eine Milliarde Euro von Kazakhtelecom. Ziel ist ein 125-Megawatt-Standort bis 2027, der letztlich bis zu 100.000 GPUs der Modelle GB300 und Vera Rubin beherbergen soll.

Australien: NVIDIA ging eine sechsjährige strategische Partnerschaft mit Sharon AI ein. Geplant ist eine 72-Megawatt-AI-Factory nach dem DSX-Design, die bis zu 40.000 Grace-Blackwell-GB300-GPUs aufnehmen soll. Sharon AI will bis Mitte 2027 mehr als 55.000 NVIDIA-GPUs insgesamt betreiben. Das Modell basiert auf Umsatzbeteiligung und Kreditunterstützung, der Fokus liegt auf flüssigkeitsgekühlten Hochleistungsrechenumgebungen.

Huang betonte bei den Ankündigungen, dass sich die Grace-Blackwell-Serie gut am Markt behaupte. Die nächste Generation, die Vera-Rubin-Architektur, habe bereits die Serienproduktion erreicht.

Leistungssprung für spezielle KI-Modelle

Milliarden-Pakt mit südkoreanischen Konzernen

AI Factory: Vom Chip zum Komplettsystem

Ähnliche Beiträge

Vera Rubin AI Factory: Japans 6,2-Milliarden-Plan für physische KI

Windows 10: 1.903 Sicherheitslücken – fast dreimal mehr als Windows 11

Apple Watch Series 11: Preise fallen auf 299 Euro nach Sommerschlussverkauf

Gaming-Zubehör: Premium-Features wie Hall-Effekt jetzt unter 100 Euro

DDR5-Speicher: Preise um 448 Prozent teurer als Vorjahr

AMD GEAK v3: 3-fache GPU-Beschleunigung für KI-Workloads