Visual Studio Code 1.125: Copilot-Cache springt um 919%

Microsofts Update bringt ein zentrales KI-Modell-Dashboard, erweiterte Unternehmenssteuerung und eine drastische Steigerung der Copilot-Cache-Treffer um über 900 Prozent.

Der neue Release bringt ein zentrales Dashboard für Sprachmodelle, schärfere Enterprise-Kontrollen und massive Performance-Sprünge bei Copilot.

Microsoft hat am heutigen Donnerstag Version 1.125 seines Entwickler-Editors Visual Studio Code veröffentlicht. Im Zentrum stehen ein neuer Language Models Editor zur vereinfachten Integration großer Sprachmodelle (LLMs) sowie erweiterte Verwaltungsfunktionen für Unternehmen. Gleichzeitig liefern Microsoft und GitHub tiefgreifende Optimierungen für GitHub Copilot – mit einer Steigerung der Cache-Treffer um über 900 Prozent.

Anzeige

Da der Einsatz von KI-Modellen wie in Visual Studio Code zunehmend reguliert wird, müssen Unternehmen die neuen rechtlichen Rahmenbedingungen genau kennen. Dieser kostenlose Leitfaden bietet einen kompakten Überblick über alle Anforderungen und Fristen des EU AI Acts. EU AI Act in 5 Schritten verstehen

Neues Dashboard für Sprachmodelle

Der neue Language Models Editor bietet Entwicklern eine zentrale Anlaufstelle, um KI-Modellanbieter zu installieren und zu verwalten. Ein eigener Button zum Hinzufügen von Providern macht die Integration verschiedener LLM-Erweiterungen deutlich einfacher. Auch der integrierte Browser wurde überarbeitet: Er unterstützt jetzt direkte Websuchen über die Adressleiste und verfügt über einen Remote-Proxy für sicheres Browsen über entfernte Verbindungen.

Für Administratoren in Unternehmen hält das Update eine wichtige Neuerung bereit: Mobile Device Management (MDM) wird nun sowohl unter Windows als auch unter macOS unterstützt. Organisationen können damit bestimmte Copilot-Einstellungen verbindlich für ihr gesamtes Entwicklerteam vorgeben. Zudem lässt sich die Verzögerung für automatische Erweiterungs-Updates jetzt konfigurieren. Hintergrund: Erst Anfang Juni hatte Microsoft in Version 1.123 eine Sicherheitsmaßnahme eingeführt, die neue Extension-Updates zunächst für zwei Stunden blockiert – ein Schutz gegen Supply-Chain-Angriffe.

Copilot: Weniger Token, weniger Wartezeit

Die technischen Verbesserungen für Copilot sind beachtlich. Durch erweitertes Prompt-Caching mit 24-Stunden-Laufzeit konnten die Cache-Trefferquoten drastisch gesteigert werden. Interne Tests zeigen für das Modell GPT-5.4 einen Anstieg der Cache-Treffer um 919 Prozent – insbesondere bei Pausen von 40 bis 60 Minuten zwischen zwei Codier-Sessions.

Auch der Token-Verbrauch sinkt spürbar: Eine neue Tool-Search-Funktion reduziert die benötigten Token pro Interaktion um 9,81 Prozent bei GPT-5.4 und um 10,92 Prozent bei GPT-5.5. Gleichzeitig senkt die Umstellung auf WebSockets die Latenz: Die Time-to-First-Token (TTFT) fiel bei GPT-5.4 um 16,37 Prozent. Ähnliche Optimierungen gibt es für die Modelle von Anthropic, darunter präzisere Cache-Breakpoints und verbesserte Suchfunktionen.

Anzeige

Die Integration mächtiger KI-Systeme bringt neben Effizienz auch neue Anforderungen an die Dokumentation und Risikobewertung mit sich. Erfahren Sie in diesem praxisnahen Report, welche KI-Anwendungen als Hochrisiko eingestuft werden und wie Sie die Compliance-Vorgaben rechtssicher umsetzen. Kostenlosen Umsetzungsleitfaden zum AI Act sichern

Eigener Arbeitsbereich für KI-Agenten

Seit gestern bietet Microsoft zudem eine dedizierte „Agents View“ an. Sie schafft einen agenten-zentrierten Arbeitsbereich für komplexe Aufgaben wie Planung, Feature-Entwicklung und Prototyping. Entwickler können mehrere Agenten parallel laufen lassen – etwa einfache Aufgaben an ein Modell delegieren, während ein leistungsfähigeres System wie Claude an anspruchsvollen Problemen arbeitet.

Dieser Schritt hin zu agentischen Workflows geht mit einer neuen Preisstruktur einher, die bereits am 1. Juni in Kraft trat. Microsoft berechnet jetzt 0,01 Euro pro 1.000 Tokens und setzt auf ein nutzungsbasiertes Abrechnungsmodell für bestimmte KI-Funktionen. Das neue dynamische Routing-System HyDRA weist Codier-Aufgaben automatisch dem effizientesten verfügbaren Modell zu.

Wettbewerb zieht nach

Die Entwicklungsumgebungen der Konkurrenz rüsten ebenfalls auf. Auf dem AWS Summit in New York stellte Amazon gestern Kiro vor – eine neue IDE, die den bisherigen Dienst Amazon Q Developer ablöst. Kiro nutzt die Easy Approach to Requirements Syntax (EARS), um formale Spezifikationen bereits vor der Code-Generierung durchzusetzen.

Auch Qt Creator 20 wurde gestern aktualisiert und unterstützt nun das Agent Client Protocol (ACP). C++- und Qt-Entwickler können damit Agenten verschiedener Anbieter – darunter GitHub Copilot und Claude Code – direkt in ihre Workflows einbinden. Der Wettlauf um die produktivste KI-gestützte Entwicklungsumgebung ist damit in vollem Gange.