Google Gemini: KI steuert jetzt Desktop und Browser automatisch

Google veröffentlicht Leitfaden für elf KI-Methoden in Workspace. Gemini 3.5 Flash steuert nun Computer und Drive erhält Projekt-Feature.

Im Zentrum steht eine umfassende Anleitung zur Nutzung des Sprachmodells Gemini im Arbeitsalltag.

Gemini als Assistent für den Arbeitsplatz

Am 27. Juni veröffentlichte der Konzern einen Leitfaden mit elf konkreten Methoden, wie Gemini die Effizienz am Arbeitsplatz steigern soll. Die Neuerungen kommen nicht allein: Google Drive erhält ein lang erwartetes Projekt-Feature, und das KI-Modell selbst wurde grundlegend aufgerüstet. Entwickler können Gemini 3.5 Flash nun sogar die Kontrolle über Computeroberflächen überlassen.

Die Drive-Funktion namens „Projects“ erlaubt es Nutzern, dedizierte Arbeitsbereiche mit bestimmten Dateien anzulegen. Das Besondere: Gemini greift dann nur auf diesen begrenzten Kontext zu. Dank einer Technik namens Retrieval-Augmented Generation zieht das System präzise Informationen aus Dokumenten, Mails und Kalendereinträgen.

Tabellen und Termine: Kleine Helfer, große Wirkung

Google Sheets bekommt ein Werkzeug zur Fehlerkorrektur per Knopfdruck. Ein Klick genügt, um Formelfehler in Tabellen zu bereinigen. Parallel dazu wurde Google Apps Script zum Kerndienst erklärt – das Skript-Tool unterliegt damit den üblichen Unternehmensdatenschutzrichtlinien.

Auch der Kalender erhält ein optisches Update. Ab dem 29. Juni rollt Google eine erweiterte Farbpalette aus: Statt bisher elf stehen dann 24 Standardfarben zur Wahl. Die Webversion und die API unterstützen zudem einen RGB-Farbwähler für bis zu 200 individuelle Farbtöne. Die mobile App bekommt die 24 Standardfarben, der volle RGB-Wähler bleibt dem Desktop vorbehalten.

Anzeige

Wer die neuen Gemini-Funktionen in Drive, Sheets und Chrome effizient nutzen will, findet im Praxis-Leitfaden eine klare 3-Schritte-Anleitung – von der Einrichtung automatisierter Workflows bis zur Desktop-Steuerung. Jetzt kostenlosen Leitfaden anfordern

KI übernimmt die Steuerung

Ein technischer Sprung gelang am 24. Juni: Gemini 3.5 Flash kann nun Computer steuern. Über eine API für Entwickler navigiert die KI durch Desktop-Umgebungen, mobile Geräte und Browser, um mehrstufige Aufgaben automatisch auszuführen. Aus Sicherheitsgründen sind menschliche Kontrollen, eine Erkennung von Prompt-Injection-Angriffen und Bestätigungen für heikle Aktionen Pflicht. Die Kosten: rund 1,40 Euro pro Million Input-Tokens.

Parallel dazu führt Chrome Version 149 das „Select from Screen“-Tool ein. Nutzer markieren Text oder Bilder auf einer Webseite und schicken sie direkt an Gemini zur Analyse. Die Integration soll den Wechsel zwischen Surfen und KI-gestützter Aufgabenbearbeitung nahtlos machen.

Neue Wege für Apps und Kommunikation

Anzeige

Tabellenfehler per Klick korrigieren, Projekte mit KI-Kontext verwalten, den Browser direkt aus Gemini steuern – der Leitfaden zeigt, wie Sie diese Tools in Ihren Arbeitsalltag integrieren. Praxis-Leitfaden jetzt sichern

Gemini erobert auch die App-Verwaltung auf Smartphones. Eine neue Google-Play-App für Gemini ermöglicht es, Anwendungen zu entdecken, zu installieren und In-App-Käufe direkt über die Chat-Oberfläche zu tätigen. Voraussetzung: ein persönliches Google-Konto und ein Mindestalter von 18 Jahren.

Google Meet hat Ende Juni Updates für iOS erhalten: Nutzer können nun über den Safari-Browser an Meetings teilnehmen. Fünfstellige Raumcodes vereinfachen den Zugang. Google Messages führt derweil individuelle Chat-Designs ein. Nutzer wählen zwischen dynamischen Farben, acht statischen Farbschemata und verschiedenen Hintergrundkategorien wie Landschaften oder Architektur. Die optischen Änderungen sieht vorerst nur der jeweilige Nutzer selbst.