Google hat auf der Entwicklerkonferenz I/O 2026 eine Reihe bahnbrechender Neuerungen vorgestellt. Die KI-Offensive zielt auf Multimodalität, autonome Assistenten und vor allem auf die drängendste Frage der Branche: die Kostenkontrolle für Unternehmen.
Während Google neue KI-Modelle für den Alltag vorstellt, wissen viele Nutzer noch gar nicht, wie sie die Technologie effizient für sich nutzen können. Ein kostenloser Ratgeber zeigt nun, wie Sie ChatGPT und Co. sofort für Ihre persönliche Organisation und Zeitersparnis einsetzen. Urlaub planen, Sprachen lernen, Zeit sparen: So erledigt ChatGPT Ihre Alltagsaufgaben in Sekunden
Gemini Omni: Video-Editieren per Sprachbefehl
Das neue Gemini Omni-Modell markiert einen Quantensprung in der KI-Interaktion. Nutzer können künftig Videoclips durch einfache Konversation generieren und bearbeiten. In Indien ist das Modell bereits live: Dort versteht die KI physikalische Prinzipien wie Schwerkraft und Bewegung in hochgeladenen Videos.
Für die Sicherheit sorgt SynthID, Googles unsichtbare Wasserzeichen-Technologie, die in alle generierten Inhalte eingebettet wird. Ein klarer Schritt gegen die wachsende Sorge um Deepfakes und Manipulation.
Parallel dazu bringt Google den Gemini 3.5 Flash an den Start – ein Hochgeschwindigkeitsmodell für sogenannte „agentische“ Arbeitsabläufe und Programmieraufgaben. Die Architektur basiert auf einem Mixture-of-Experts (MoE)-System und unterstützt einen Kontext von einer Million Tokens.
Die Benchmarks sprechen eine deutliche Sprache: Mit 47,1 Prozent im APEX-Agents-AA und 84 Prozent im MMMU-Pro führt das Modell in spezifischen Disziplinen. Bei Allgemeinwissen und komplexen Codieraufgaben liegt es jedoch hinter den Flaggschiff-Modellen zurück.
Die Kostenfalle: Warum Unternehmen umdenken müssen
Googles Führungsspitze schlug auf der I/O alarmierende Töne an. Viele Unternehmen hätten ihre Jahresbudgets für Tokens bereits im Mai aufgebraucht. Der Trend gehe weg von reiner Rechenleistung hin zur Frage: Was bringt die KI tatsächlich an Rendite?
Interne Analysen zeigen ein enormes Einsparpotenzial: Über eine Milliarde Euro jährlich könnten Google-Cloud-Kunden sparen, wenn sie rund 80 Prozent ihrer KI-Workloads auf das Flash-Modell verlagern. Der Preisvorteil gegenüber Wettbewerbern liegt demnach zwischen 50 und 75 Prozent – möglich gemacht durch Googles eigene TPU-Chips und Rechenzentren.
Die schiere Dimension wird an einer Zahl deutlich: 3,2 Billiarden Tokens verarbeitet die Infrastruktur monatlich – ein Anstieg um das Siebenfache gegenüber dem Vorjahr.
Die API-Preise für Gemini 3.5 Flash liegen bei 1,50 Euro pro Million Input-Tokens, 0,15 Euro für gecachte Tokens und 9,00 Euro für Output-Tokens. Das bedeutet eine Verdreifachung gegenüber dem Vorgänger – ein kalkulierter Schritt, der die höhere Leistungsfähigkeit widerspiegelt.
Gemini Spark: Der Assistent, der nie schläft
Mit Gemini Spark führt Google einen rund um die Uhr aktiven persönlichen Assistenten ein. Verfügbar zunächst für AI-Ultra-Abonnenten in den USA, läuft Spark auf cloudbasierten virtuellen Maschinen und integriert sich tief in Google Workspace. Der Assistent verwaltet Termine, durchsucht E-Mails und organisiert Dateien – selbst wenn das Hauptgerät ausgeschaltet ist.
Für Pro- und Ultra-Abonnenten plant Google noch im Sommer die Einführung von „Informationsagenten“. Das smarte Zuhause profitiert ebenfalls: Gemini for Home erlaubt es, Nest-Cam-Ereignisse – etwa ein Haustier in einem verbotenen Bereich – per natürlichsprachlicher Konfiguration in automatische Aktionen zu übersetzen, wie das Einschalten der Außenbeleuchtung.
Ob automatisierte Assistenten oder komplexe Datenverarbeitung – viele Anwender nutzen nur einen Bruchteil der verfügbaren KI-Funktionen im Alltag. Dieser neue Gratis-Report enthüllt die praktischsten Befehle und Tricks, mit denen Einsteiger ohne Vorkenntnisse sofort durchstarten können. Diese einfachen ChatGPT-Befehle kennen die wenigsten – dabei erleichtern sie den Alltag enorm
Neue Regeln: Schluss mit frustrierenden Limits
Google hat auf Nutzerbeschwerden reagiert und sein Quotensystem grundlegend überarbeitet. Fehlgeschlagene Anfragen werden künftig nicht mehr auf das Kontingent angerechnet. Die Interaktion mit Gemini Flash-Lite ist jetzt kostenlos.
Ein Bug bei der Videogenerierung von Gemini Omni wurde behoben. Ultra-Abonnenten erhalten nun das Doppelte des bisherigen Generierungskontingents.
Ab dem 3. Juni 2026 können Nutzer Gemini-Chats über Google Drive teilen. Empfänger können die Unterhaltung in ihrem eigenen Arbeitsbereich fortsetzen, ohne das ursprüngliche Dokument des Besitzers zu verändern.
Der heimliche Datenspeicher: Gemini Nano auf dem Desktop
Eine weniger beachtete, aber folgenreiche Neuerung: Google Chrome lädt automatisch ein 4 Gigabyte großes Gemini-Nano-Modell auf kompatible Geräte mit Windows, macOS und Linux herunter. Das lokale Modell soll Funktionen wie Schreibhilfe, Zusammenfassungen und Betrugserkennung direkt auf dem Gerät ermöglichen.
Die automatische Natur des Downloads hat jedoch Diskussionen ausgelöst. Vier Gigabyte sind kein Pappenstiel – besonders auf Geräten mit knappem Speicherplatz. Ob der Nutzen die Kosten rechtfertigt, wird sich zeigen müssen.

