Die Entwicklung der künstlichen Intelligenz hat diese Woche einen entscheidenden Schritt nach vorne gemacht. Gleich mehrere Technologiekonzerne präsentierten autonome Agenten, die eigenständig arbeiten – vom Smartphone-Nutzer bis zur vollautomatischen Fabrik. Im Zentrum stehen dabei Hintergrundautomatisierung und physikalische Denkfähigkeiten.
Während Google und NVIDIA die technologischen Grenzen verschieben, fragen sich viele Privatanwender noch immer, wie sie die neue Technologie im Alltag sicher und effizient nutzen können. Dieser kostenlose Ratgeber zeigt Ihnen, wie Sie KI-Tools für Ihre persönliche Organisation und Zeitersparnis einsetzen. Urlaub planen, Sprachen lernen, Zeit sparen: So erledigt ChatGPT Ihre Alltagsaufgaben in Sekunden
Gemini Spark: Der unsichtbare Helfer
Google hat am 31. Mai 2026 mit dem Rollout von Gemini Spark für seine AI-Ultra-Abonnenten in den USA begonnen. Der autonome Agent arbeitet im Hintergrund – selbst wenn das Gerät ausgeschaltet ist. Das System kann eigenständig im Internet suchen, Kalender verwalten, Nachrichten versenden und Reservierungen vornehmen. Allerdings: Vor wichtigen Aktionen muss der Nutzer zustimmen.
Parallel dazu haben Workday und Google Cloud am 1. Juni 2026 ihre Partnerschaft ausgeweitet. Der „Sana Self-Service Agent“ ist nun im Early Access für Gemini-Enterprise-Nutzer verfügbar. Mitarbeiter können über eine Chat-Oberfläche Personal- und Finanzdaten abfragen. Die Technologie nutzt eine „Zero-Copy“-Architektur, die Workday Data Cloud mit der Google Cloud Lakehouse verbindet. Gemini fungiert dabei als Standard-Sprachmodell. Beratungsriesen wie Accenture, Deloitte und KPMG sind als Partner mit an Bord.
NVIDIA treibt die Fabrikautomatisierung voran
Auf den Messen GTC Taipei und COMPUTEX stellte NVIDIA am 1. Juni 2026 neue Frameworks für die Industrie vor. Der Factory Operations Blueprint (FOX) ist ein Referenzdesign für Agenten, die autonome Fabriken steuern sollen. Erste Anwender sind Advantech, Foxconn, Pegatron und Wistron.
Die ersten Ergebnisse können sich sehen lassen: Bei Foxconn verbesserte sich die Fehlerursachenanalyse um 80 Prozent, die Arbeitsproduktivität stieg um 15 Prozent, während die Maschinenausfallzeiten um zehn Prozent sanken. Pegatron meldet eine Reduzierung der Geräteredundanz um 15 Prozent, Advantech spart zehn Prozent Energie.
Für die Robotik kündigte NVIDIA zudem Cosmos 3 an – ein quelloffenes „World Foundation Model“ für physikalische KI. Das Modell wurde mit 20 Billionen Tokens trainiert und kombiniert Weltsimulation mit physikalischem Denken und Aktionsgenerierung. Es gibt zwei Versionen: eine „Nano“-Variante mit acht Milliarden Parametern und eine „Super“-Version mit 32 Milliarden Parametern. Entwicklungspartner sind unter anderem Agile Robots und Black Forest Labs.
Mit dem Einzug autonomer Systeme in die Arbeitswelt steigt auch die Unsicherheit über die korrekte Anwendung von KI-Assistenten. Ein neuer Gratis-Report enthüllt die praktischsten Tricks für Einsteiger, um die Möglichkeiten der künstlichen Intelligenz ohne Vorwissen sofort voll auszuschöpfen. Diese einfachen ChatGPT-Befehle kennen die wenigsten – dabei erleichtern sie den Alltag enorm
Agentic Commerce: Der Handel wird intelligent
Auch der Einzelhandel entdeckt die autonomen Agenten. Shopware kündigte an, dass Version 6.7.10.0 am 5. Juni 2026 „Agentic Commerce“ einführen wird. Die Funktion schafft einen eigenen Verkaufskanal für KI-gesteuerte Produktfeeds und stattet das Copilot-Tool mit blueprintbasierten Agentenfähigkeiten aus.
Menschliche Trainer für Roboter – ein lukratives Geschäft
Der wachsende Bedarf an spezialisierten Trainingsdaten für KI schafft neue Geschäftsmodelle. Firmen wie Encord setzen menschliche Trainer ein, die Robotern Bewegungen beibringen – per „Puppeteering“ oder Fernsteuerung. Diese hochpräzisen Daten kosten bis zu 1.000 Euro pro Stunde. Analysten von Goldman Sachs prognostizieren, dass der Markt für humanoide Robotik bis 2035 auf 38 Milliarden Euro anwachsen könnte.
Preissenkungen und Milliarden-Finanzierungen
Sarvam AI senkte am 29. Mai 2026 die Preise für seine Vision-API drastisch: um 67 Prozent von 1,5 auf 0,5 Rupien pro Seite. Grundlage ist die Digitalisierung von über 35 Millionen Seiten seit dem Start der API im Februar.
Parloa sicherte sich derweil 350 Millionen Euro in einer Series-D-Finanzierungsrunde und wird nun mit drei Milliarden Euro bewertet. Das Unternehmen integriert seine KI-Agenten in die SAP Service Cloud und arbeitet mit Microsoft Azure und OpenAI zusammen, um konforme Lösungen für Gesundheitswesen und Unternehmen zu liefern.

