Nvidia stellt heute seinen ersten reinen KI-Inferenz-Prozessor vor. Der Chip soll die Marktherrschaft des Grafikspezialisten im Milliardenmarkt für KI-Anwendungen zementieren.
Heute um 20:00 Uhr mitteleuropäischer Zeit betritt Nvidia-Chef Jensen Huang die Bühne der GPU Technology Conference (GTC) in San Jose. Alle Augen sind auf seine Keynote gerichtet. Erwartet wird die Vorstellung einer neuen Produktlinie: Language Processing Units (LPUs). Diese spezialisierten Chips sind nicht für das Training, sondern für den Betrieb von KI-Modellen gedacht – also genau das, was Unternehmen für Chatbots, Übersetzer oder autonome Agenten brauchen.
Während Nvidia die technische Basis für neue KI-Anwendungen legt, müssen Unternehmen die rechtlichen Leitplanken des EU AI Acts beachten. Dieser kostenlose Leitfaden bietet eine kompakte Zusammenfassung aller Anforderungen und Fristen für eine rechtssichere Umsetzung. Umsetzungsleitfaden zur KI-Verordnung gratis downloaden
Vom Training zum Betrieb: Die neue KI-Ära bricht an
Die Branche steht an einem Wendepunkt. Bisher floss der Großteil der Rechenpower in das Training großer Modelle. Jetzt verlagert sich der Fokus auf die Inferenz – den eigentlichen Einsatz. Analysten schätzen, dass dieser Markt bereits heute bis zu 150 Milliarden Euro umfasst. Künftig soll er den Großteil der Rechennachfrage ausmachen.
„Die Zeiten, in denen teure Trainings-GPUs auch für einfache Abfragen genutzt wurden, sind vorbei“, erklärt ein Branchenkenner. Die Energiekosten seien schlicht untragbar. Nvidias neuer LPU soll hier Abhilfe schaffen. Berichten zufolge setzt der Chip nicht auf den knappen Speicher HBM, sondern auf SRAM-Technologie. Das verspricht ultra-kurze Latenzzeiten und umgeht Engpässe in der Lieferkette.
Der Groq-Deal: 20 Milliarden Euro für die Technologie der Zukunft
Die Grundlage für den neuen Chip legte Nvidia im Dezember 2025 mit einem spektakulären Deal. Für rund 20 Milliarden Euro sicherte sich das Unternehmen eine Lizenz für die Inferenz-Technologie des Start-ups Groq. Zudem wechselten Schlüsselentwickler, darunter Gründer Jonathan Ross, zu Nvidia.
Der technologische Fortschritt durch spezialisierte KI-Chips bringt auch neue Herausforderungen für die IT-Sicherheit in Unternehmen mit sich. Wie Sie sich proaktiv vor Cyberangriffen schützen und aktuelle gesetzliche Vorgaben erfüllen, zeigt dieser praxisnahe Experten-Report. Experten-Report zur Cyber-Security kostenlos anfordern
Das Manöver war clever: Statt einer riskanten Übernahme wählte Nvidia eine strategische Lizenzvereinbarung. So konnte es schnell an Spitzentechnologie gelangen, ohne sich mit Kartellbehörden anlegen zu müssen. Groq agiert weiterhin unabhängig, während Nvidia die Architektur in sein Ökosystem integriert.
Konkurrenz schläft nicht: Meta und Cloud-Giganten drängen nach
Der Zeitpunkt für Nvidias Vorstoß ist kein Zufall. Der Wettbewerb um Inferenz-Hardware heizt sich massiv auf. Erst vergangene Woche stellte Meta vier eigene KI-Chips vor, die speziell für generative KI optimiert sind. Der Konzern plant, seine Silizium-Designs künftig alle sechs Monate zu erneuern – ein Affront gegen die jahrelangen Entwicklungszyklen der Branche.
Auch die großen Cloud-Anbieter wollen unabhängiger werden. Amazon, Google und Microsoft entwickeln eifrig eigene Custom Chips (ASICs). Amazon setzt zudem in einer langfristigen Partnerschaft auf Hardware von Cerebras Systems. Nvidias Mission ist klar: Mit der LPU-Plattform muss das Unternehmen beweisen, dass seine Kombination aus Hardware und Software auch in der neuen Inferenz-Ära unschlagbar ist.
Was bedeutet das für die Branche?
Gelingt Nvidia heute der Wurf, könnte das die Wachstumserzählung des Unternehmens für Jahre stützen. Entscheidend werden die technischen Details sein: Energieeffizienz, Preis und vor allem der Lieferzeitplan. Die Cloud-Riesen planen gerade ihre Infrastruktur-Budgets für die kommenden Jahre.
Die Weichen, die auf der GTC diese Woche gestellt werden, bestimmen, wie die Industrie die nächste Stufe der KI erklimmt. Es geht um autonome Agenten und Echtzeit-Anwendungen. Nvidia will der Architekt dieser Zukunft sein – doch die Konkurrenz ist nah dran.



