Mehrere Technologiekonzerne und Startups haben diese Woche KI-Assistenten vorgestellt, die direkt auf dem heimischen Rechner laufen. Die sogenannten „Local-First“-Anwendungen setzen auf Datenschutz und Geschwindigkeit, indem sie große Sprachmodelle lokal ausführen statt in der Cloud.
Kimi und Tencent treiben die Entwicklung voran
Am 12. Juni 2026 brachte Moonshot AI Kimi Work auf den Markt – einen universellen lokalen Assistenten für Wissensarbeiter. Die vom Kimi-Code-Team entwickelte Software kann komplexe Aufgaben wie die Zerlegung von Projektanforderungen, die Verwaltung von Ordnern sowie die eigenständige Erstellung von Dokumenten, Tabellen und Präsentationen übernehmen. Das System nutzt eine „Agent Swarm“-Architektur, bei der bis zu 300 Unter-Agenten parallel zusammenarbeiten. Das soll die Verarbeitungsgeschwindigkeit um das 4,5-Fache im Vergleich zu Einzel-Agenten-Systemen steigern.
Anzeige: Wer Cloud-KI-Datenschutzrisiken vermeiden und gleichzeitig die 4,5-fache Verarbeitungsgeschwindigkeit lokaler Agenten nutzen will, findet im Leitfaden eine Schritt-für-Schritt-Migration und einen Vergleich der fünf schnellsten Desktop-Agenten. Jetzt Local-First-Leitfaden anfordern
Tencent beschleunigt ebenfalls seine Desktop-KI-Strategie und bringt den WorkBuddy-Agenten weltweit auf den Markt. Ursprünglich im März 2026 in China gestartet, wo das Tool bei den täglichen Nutzerzahlen für PC-Produktivitätstools führend ist, bietet die Anwendung nun über 100 Expertenrollen. Sie integriert sich in Kommunikationsplattformen wie Slack, Discord und Telegram und arbeitet in einer abgeschotteten Sicherheitsumgebung für die lokale PDF-Verarbeitung. Interne Berichte zeigen, dass Tencent WorkBuddy gegenüber anderen KI-Projekten priorisiert hat – das Entwicklungsteam wuchs von 10 auf über 100 Mitarbeiter, um die hohen Nutzerzahlen zu bewältigen.
Bereits am 9. Juni 2026 wurde das Produktivitätstool TRAE SOLO zu TRAE Work aufgerüstet. Das Update erweiterte die KI-Programmierfähigkeiten auf breitere Aufgaben wie Datenanalyse und Berichterstellung. Das Tool kann CSV-Datensätze von rund 100 MB verarbeiten und interaktive Web-Berichte lokal generieren.
Neue Infrastruktur für lokale KI
Der Boom lokaler Anwendungen wird durch neue Software-Optimierungen und erweiterte Hardware-Schnittstellen unterstützt. Google DeepMind veröffentlichte am 10. Juni 2026 DiffusionGemma – ein experimentelles Open-Source-Modell für parallele Textgenerierung. NVIDIA hat dieses Modell für seine GeForce RTX- und RTX PRO-Hardware optimiert und erzielt auf High-End-Workstations bis zu 2.000 Tokens pro Sekunde – deutlich schneller als herkömmliche autoregressive Modelle.
Microsoft senkt zudem die Hardware-Hürde für lokale KI unter Windows 11. Der Konzern erweiterte seine lokalen Language-Model-Schnittstellen auf PCs ohne „Copilot+“-Branding, sofern sie eine NVIDIA GeForce RTX-30-Serie oder neuer mit mindestens 6 GB VRAM besitzen. Diese Schnittstellen nutzen Phi Silica, ein kompaktes On-Device-Modell, für Aufgaben wie Textzusammenfassungen und Tabellenerstellung – ohne Daten in die Cloud zu senden.
Fokus auf Privatsphäre und Offline-Produktivität
Mehrere unabhängige Entwickler haben spezialisierte „Offline-First“-Tools veröffentlicht, die auf wachsende Bedenken hinsichtlich Datenschutz und Cloud-Abhängigkeit reagieren:
- XClaw: Gestartet am 10. Juni 2026 von Star-Ring Technology, unterstützt Windows, Mac und Linux. Enthält einen „Skills-Markt“ und ein lokales Sicherheitssystem, das für sensible Operationen die Benutzerbestätigung verlangt.
- Hermes Desktop: Veröffentlicht am 2. Juni 2026 von Nous Research, bietet eine grafische Oberfläche für den Hermes-Agenten. Anbieterneutral – Nutzer können zwischen lokalen Backends wie Ollama und externen APIs wechseln.
- Focus Stream: Kürzlich im Microsoft Store erschienen, nutzt ein Llama 3.2 1B-Modell zur Verfolgung der PC-Aktivität und erstellt Fokus-Tagebücher komplett auf dem Gerät – basierend auf der Rust-basierten mistral.rs-Inferenz-Engine.
- Rank-Forge: Eine neue Windows 10/11-Anwendung, die einen Aufgabenplaner mit einer einsteckbaren KI-Ebene kombiniert. Kein Konto oder Cloud-Verbindung erforderlich.
Während viele Tools auf Effizienz setzen, berichten Nutzer von Ressourcenproblemen bei etablierten Plattformen. Aktuelle GitHub-Dokumentation zeigt, dass Anthropics Claude Desktop bei jedem Start eine 1,8 GB große virtuelle Maschine namens „Cowork“ startet – selbst wenn die Funktion nicht aktiv angefordert wird.
Anzeige: Statt langsamer Cloud-Verarbeitung und Abhängigkeit von externer Infrastruktur setzen immer mehr Unternehmen auf lokale KI. Der Leitfaden zeigt, wie Sie mit Tools wie Kimi Work oder TRAE Work Ihre Produktivität steigern – ohne Daten aus der Hand zu geben. Local-First-Strategie jetzt sichern
Startup-Finanzierung und Ausblick
Im Startup-Bereich sicherte sich das in Hangzhou ansässige Unternehmen NoDesk AI kürzlich eine Finanzierung von rund 100 Millionen Yuan (etwa 13 Millionen Euro). Dessen Flaggschiff-Produkt DeskClaw, das Mitte Februar 2026 startete, ermöglicht die Bedienung von Browsern und lokalen Anwendungen – wobei die Daten strikt auf dem lokalen Rechner verbleiben.
Die Entwicklung zeigt: Lokale KI-Assistenten sind kein Nischenphänomen mehr. Sie könnten die Art und Weise, wie wir mit unseren Computern arbeiten, grundlegend verändern – und das ohne Kompromisse beim Datenschutz.

