GitHub Copilot: Ab Juni token-basiert – Kosten steigen um das Zehnfache

GitHub Copilot wechselt zur Token-Abrechnung. Entwickler berichten von massiven Kostensteigerungen, Microsoft verteidigt den Schritt mit hohen Infrastrukturkosten.

Einige Nutzer berichten von Kostensteigerungen um das Zehnfache.

Ab dem 1. Juni 2026 stellt GitHub Copilot auf ein token-basiertes Abrechnungsmodell um. Die bisherige Flatrate gehört damit der Vergangenheit an. Stattdessen zahlen Nutzer künftig für ihren tatsächlichen Verbrauch an sogenannten KI-Credits. Die Reaktionen der Community fallen deutlich aus: Der offizielle Ankündigungsbeitrag erhielt knapp 900 negative Bewertungen bei nur etwas über 20 positiven Stimmen.

So funktioniert das neue Modell

Anzeige: Wer die drastischen Kostensteigerungen von GitHub Copilot ab Juni 2026 vermeiden will, findet in diesem Report drei sofort umsetzbare Strategien – von Token-Optimierung bis zu Open-Source-Alternativen. Jetzt kostenlosen Optimierungs-Report anfordern

Die Grundgebühren bleiben zunächst stabil: Pro-Nutzer zahlen weiterhin 10 Euro, Business-Kunden 19 Euro im Monat. Allerdings enthalten diese Beträge künftig nur noch ein Basis-Kontingent an KI-Credits. Wer dieses überschreitet, zahlt pro verbrauchtem Token extra.

GitHub-Verantwortliche verteidigen den Schritt. Chief Product Officer Mario Rodriguez erklärte, das alte Flatrate-Modell sei nicht mehr tragbar gewesen. Brancheninternen Schätzungen zufolge machte Microsoft unter der alten Struktur mit jedem Nutzer monatlich rund 20 Euro Verlust – die Infrastrukturkosten waren schlicht zu hoch. Unternehmen erhalten für die ersten drei Monate Budgetkontrollen und sogenannte Aktions-Credits, um den Übergang abzufedern.

Entwickler berichten von drastischen Kostenexplosionen

Erste Erfahrungsberichte aus der Community zeichnen ein düsteres Bild. Ein Nutzer berichtet von einem Anstieg seiner monatlichen Kosten von rund 29 auf 750 Euro. Ein anderer meldet einen Sprung von 50 auf 3.000 Euro.

Hauptgrund sind neue Multiplikatoren für leistungsstärkere Modelle. Der Faktor für Opus 4.7 stieg demnach von 7,5 auf 27. Kritiker weisen darauf hin, dass eine einzige intensive Agentensitzung das gesamte Monatskontingent eines Standard-Pro-Plans aufbrauchen kann.

Hohe KI-Kosten belasten die Tech-Branche

Der Schritt ist kein Einzelfall. Microsoft hatte zuvor selbst die intensive Nutzung von KI-Tools beworben – etwa durch sogenanntes „Vibe Coding“. Ausgerechnet diese Praxis wird nun für viele unerschwinglich. Die Kosten für den Betrieb großer Sprachmodelle sind selbst für Tech-Giganten zu einer enormen Belastung geworden.

Bereits Anfang des Jahres wies Microsoft eigenen Angaben zufolge 100.000 seiner Ingenieure an, bestimmte KI-Tools nicht mehr zu nutzen – die Betriebskosten überstiegen schlicht deren Gehälter. Auch andere Unternehmen kämpfen mit dem Preisdruck: Uber hatte sein gesamtes KI-Budget für 2026 bereits im April aufgebraucht.

Anzeige: Entwicklerteams, deren Monatskontingent bereits durch eine einzige Agentensitzung aufgebraucht wird, brauchen dringend eine Budget-Überwachung. Dieser Leitfaden liefert eine konkrete Checkliste und zeigt, wie Sie mit Project Headroom Ihren Token-Verbrauch senken. Budget-Checkliste jetzt sichern

Alternativen und Auswege

Die Industrie sucht händeringend nach Lösungen. Google brachte am 20. Mai 2026 Gemini 3.5 Flash als kostengünstigere Alternative für Unternehmen auf den Markt. Parallel dazu gewinnen Open-Source-Lösungen an Bedeutung. Seit Januar 2026 steht mit „Project Headroom“ ein Tool zur Verfügung, das den Token-Verbrauch senkt, indem es redundante Daten aus Kontextfenstern entfernt. Entwickelt wurde es von einem Netflix-Ingenieur.

GitHub Copilot zählte im Januar 2026 rund 4,7 Millionen zahlende Abonnenten. Die neue „One Copilot“-Initiative unter der Leitung von Jacob Andreou soll die verschiedenen Dienste in einer einzigen Anwendung bündeln. Für viele Nutzer steht jedoch die Frage im Vordergrund, wie sie mit den unberechenbaren Kosten des neuen Systems umgehen sollen.