Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren

Veröffentlicht am 2. Juli 2026 von Günter Born

Die Token-Kosten für die Nutzung von KI-Angeboten explodieren geradezu, seit die Anbieter diese nach Verbrauch abrechen. Ein Entwickler hat das Plugin Caveman veröffentlicht, welches die Nutzung von Tokens minimieren soll.

Explosion der KI-Token-Kosten

Ich hatte Anfang Juni 2026 im Beitrag Zerschellt der KI-Traum an den gigantischen (Token-)Kosten? über die Explosion der Token-Kosten für die KI-Nutzung berichtet. Das autonome Taxi-Unternehmen Uber hat sein KI-Jahresbudget für 2026 in einem Monat verbrannt.

Accenture stellte laut nachfolgendem Tweet fest, dass ein Großteil seiner "explodierenden Token-Kosten" darauf zurückzuführen war, dass Mitarbeiter PDFs in Präsentationen umwandelten. Weiterhin wurde von einem Unternehmen berichtet, welches 500 Millionen US-Dollar an Token-Kosten binnen eines Monats angehäuft hat. Meinen Informationen nach war dies Amazon, wo die Belegschaft vor Monaten noch angehalten wurde, KI "auf Teufel komm raus zu nutzen".

Firmen reduzieren inzwischen die Nutzung der KI durch ihre Mitarbeiter. Microsoft hat die Verwendung von Claude Code für Entwickler extrem eingeschränkt und stellt diesen Copilot als Alternative bereit. Der Traum von der breiten AI-Nutzung verpufft gerade. Und erste Firmen werfen Mitarbeiter raus, um ihre KI-Rechnungen nach bezahlen zu können.

Ed Zitron deutet in diesem Tweet an, dass die Abrechnung der KI-Kosten für viele Unternehmen ziemlich undurchsichtig ist und diese nicht wissen, wofür sie KI überhaupt einsetzen. KPMG hat diesen "Blindflug" bezüglich der Kosten in einer Analyse offen gelegt. Ich hatte dies im Beitrag Firmen haben keine Kontrolle über ihre AI-Kosten angesprochen.

Und Gartner prognostiziert, dass die KI-Token-Kosten im Jahr 2028 die Gehälter der sie nutzenden Entwickler übersteigen werde. heise hat das beispielsweise in diesem Artikel aufgegriffen. Die Firmen werden sich da also etwas in Bezug auf die KI-Nutzung bei der Entwicklung von Software überlegen müssen. Ich sehe auf X in den letzten Wochen häufiger Meldungen, wo Software-Entwickler den Einsatz von KI stark zurück fahren oder sogar gänzlich einstellen, da die Erwartungen nicht erfüllt wurden.

Caveman soll KI-Token-Verbrauch reduzieren

Jede Maßnahme, die den Token-Verbrauch reduziert, wirkt sich also sofort auf die Kosten aus. Ich bin über nachfolgenden Tweet auf einen entsprechenden Sachverhalt aufmerksam geworden: Ein Plugin, welches den KI-Token-Verbrauch reduzieren soll.

Caveman AI-Token-Minimizer

Das Plugin "caveman" (Höhlenmensch) soll KI-Tools zwingen, Artikel, Füllwörter und Höflichkeitsfloskeln aus ihren vom LLM generierten Antworten zu entfernen, um die Token-Kosten zu senken. Bei Claude Code soll das bis zu 65% Token-Einsparung bringen, heißt es.

Die Eigenbeschreibung lautet, dass das Plugin für Claude-Code sowie weitere AI-Produkte wie Codex, Gemini, Cursor, Windsurf, Cline, Copilot und über 30 weitere die Anzahl der benötigten KI-Tokens um ca. 75 % reduziert und trotzdem die volle technische Genauigkeit der Anfragen bewahrt. Die an die LLMs gestellten Prompts werden dazu entsprechend vor dem Absenden um die oben angesprochenen Inhalte und Floskeln bereinigt.

Ein leitender Mitarbeiter von OpenAI habe dabei geholfen, ein Tool zu entwickeln, das die Nutzung des eigenen Produkts von OpenAI kostengünstiger macht, heißt es in obigem Tweet. Das Tool hat 54.000 Sterne auf GitHub und Entwickler bei OpenAI, Nvidia und GitHub sollen das Plugin bereits nutzen. Das Plugin Caveman wird von Julius Brussee auf GitHub angeboten.

Dieser Beitrag wurde unter AI, Software, Tipps abgelegt und mit AI, Software, Tipp, Token verschlagwortet. Setze ein Lesezeichen für den Permalink.

17 Kommentare zu Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren

Chris sagt:

2. Juli 2026 um 11:29 Uhr

Quasi der AddBlocker für KI Tools, bin mal gespannt ob da seitens der KI Anbieter vorgegangen wird, schließlich bedeutet eine Reduzierung der KI Tokens um 75% auch ein Umsatzverlust von 75%.

Auf der anderen Seite, wenn Artikel, Füllwörter und Höflichkeitsfloskeln für 75% des Tokenverbrauchs verantwortlich sind, läuft beim Thema KI und Tokenabrechnung einiges schief. Denn anscheinend wird dann stumpf nach "Anzahl von Zeichen" bei einer Antwort abgerechnet und nicht nach "Rechenaufwand und Stromverbrauch" der wirklichen Aufgabe.

Die KI Anbieter können so leicht den Umsatz hochschrauben, man gibt der KI vor ausführlicher zu Antworten. Ergänze jede Antwort um 10% mehr Text durch eine ausführliche Antwort, und schon hat man 10% mehr Umsatz.

Antworten
- HoldThePhone sagt:
  
  2. Juli 2026 um 12:26 Uhr
  
  So wie ich es verstanden habe wird jedes Wort im Vorfeld in einen Token "umgewandelt" damit KI etwas damit anfangen kann.
  Genau so läuft das auf dem Rückweg natürlich auch, damit es für uns leserlich wird.
  Sprich, die Abrechnung nach Token ist auch zwangsläufig eine Abrechnung nach Wortanzahl.
  
  Die 75% "filler" lassen sich also einfach auf den Aufbau unserer Sprache zurückführen, dahingehend läuft nix "schief".
  Wenn ich einen Zeitungsartikel auf die wichtigsten Stichpunkte zusammenstreiche fliegt auch die Mehrheit der Wörter raus.
  
  Was aber natürlich stimmt ist, dass die Anbieter über die ausgegebene Ausführlichkeit der Antwort einfach an der Preisschraube drehen können ohne real den Preis für das Abo selbst zu erhöhen.
  
  Antworten
  - Chris sagt:
    
    2. Juli 2026 um 14:12 Uhr
    
    Die Krux dabei ist ja, das der Kunde am Ende sogar noch zufrieden ist.
    
    Beispiel:
    Jemand nutzt die kostenlose Version eines KI Tools, dieser Version formuliert die Antworten immer knapp, so spart der Anbieter den Verbrauch von Tokens. Irgendwann wechselt der Benutzer von der kostenlosen Version auf eine Bezahlversion. Bei den ersten Antworten bemerkt der Benutzer direkt, dass die Antworten viel ausführlicher und verständlicher sind. Der Benutzer sitzt dann vor dem Bildschirm und denkt sich, wow das ist ja viel besser als bei der kostenlosen Version, hätte ich mal früher gewechselt. Das ihm diese Art der Antworten mehr Geld kosten hat er gar nicht auf dem Schirm.
    
    Antworten
  - RSD sagt:
    
    2. Juli 2026 um 14:58 Uhr
    
    Es wird nicht unbedingt jedes Wort umgewandelt, längere Wörter können auch mehrere Tokens verwenden. Aber im Groben stimmt das, ja. Ist auch für den "Context-Rot" wichtig: Eine KI speichert eine Unterhaltung in einem Kontext, der auch Token verschlingt. Den flach zu halten in längeren Gesprächen sorgt für mehr Zuverlässigkeit bevor das Modell irgendwann versagt.
    
    Antworten
- J.M sagt:
  
  2. Juli 2026 um 13:47 Uhr
  
  Wir wollen nur Ihr bestes ($$$)
  Ich verstehe ja noch wenn irgendein Prozess automatisiert wird.
  Dazu haben wir unsere Programmiersprachen,zb.PowerShell etc.
  Der Code wird kompiliert,oder Interpreter.
  Gedanken eines MENSCHEN !!!,die einer Maschine aufgegeben werden !!!
  UMGEKEHRT habe ich höchste Bedenken !!!
  Die Anwendung in KRITIS gehört sowieso absolut ausgeschlossen !!!
  
  Antworten
M sagt:

2. Juli 2026 um 13:51 Uhr

@GBorn

Im vorletzten Absatz hat scheinbar die "no fluff"-Direktive zugeschlagen und den letzten Satz abgeschnitten:

> Die an die LLMs gestellten Prompts werden dazu entsprechend vor dem
> Absenden um die oben angesprochenen Inhalte und Floskeln

Grüße

Antworten
- peter0815 sagt:
  
  2. Juli 2026 um 14:31 Uhr
  
  Das dürfte ein generelles Problem mit diesem neuen Kostensenker werden.
  
  "Unsere AI fabuliert gerade nicht. Sie negiert nur einmal zu viel oder wenig."
  
  Antworten
RSD sagt:

2. Juli 2026 um 14:56 Uhr

"Why use many word when few word do trick?"

Antworten
- robbi sagt:
  
  8. Juli 2026 um 11:10 Uhr
  
  klingt eher nach google translate 2006
  
  Antworten
viebrix sagt:

2. Juli 2026 um 17:22 Uhr

Wenn ich die KI dann bitte mir eine E-Mail zu schreiben oder nur zu übersetzen, dann lässt sie alle Höflichkeitsfloskeln weg?

Antworten
Christian Krause sagt:

2. Juli 2026 um 18:02 Uhr

"Ich schreibe dir einen langen Brief, weil ich keine Zeit habe, einen kurzen zu schreiben."
Blaise Pascal (1623 – 1662)

(Je n'ai fait cette lettre-ci plus longue que parce que je n'ai pas eu le loisir de la faire plus courte.)

…wusste schon Blaise Pascal

Antworten
Christian sagt:

2. Juli 2026 um 19:05 Uhr

Der nächste Schritt ist dann, mit der KI so zu kommunizieren als könne sie Gedanken lesen. Anschließend entwickelt die KI dann eine Zwischen-KI, um sich nicht mehr selbst mit den undurchdachten, unspezifischen Anfragen herumzuschlagen, die vermutlich nicht einmal im Kopf des Fragestellers einen Sinn ergeben.

Antworten
Karli sagt:

3. Juli 2026 um 01:27 Uhr

Die alten Zeiten. FASSE DICH KURZ!

Antworten
xx sagt:

3. Juli 2026 um 17:06 Uhr

Juhu, endlich ein "Calgon"-Waschmittel Zusatz für KI.
Man gibt mehr Geld für einen neuen Layer aus, mit dem Versprechen in anderen Layern dann vielleicht Geld zu sparen.

Antworten
Florian Ulrich sagt:

8. Juli 2026 um 10:23 Uhr

Ich bin mal gespannt, was sich hier ergeben wird. Ich persönlich nutze auch immer nur die Abos von OpenAI und Claude, weil die reinen API-Kosten wirklich heftig wären. Ich glaube, es geht auch darum, viel in der Arbeitsweise darin mitzugeben, wie man diese Tokens sparen kann.

Ich glaube, viele Unternehmen haben einfach AI viel zu schnell an die Mitarbeiter ausgerollt, ohne diese entsprechend zu schulen.

Antworten
- Techie der alten Schule sagt:
  
  8. Juli 2026 um 11:26 Uhr
  
  Viele Unternehmen haben einfach AI viel zu schnell ausgerollt, ohne zu überlegen, wofür es in ihren Unternehmen wirklich Sinn macht und dass zwangsläufig die Kosten explodieren werden müssen.
  
  Antworten
Emma @ RabattCode Pro sagt:

10. Juli 2026 um 11:50 Uhr

Wenn Tools wie Caveman den Token-Verbrauch so drastisch senken können, werden KI-Anbieter dann irgendwann ihre Preismodelle ändern, um den Schwerpunkt weniger auf die Anzahl der Token zu legen?

Antworten

Schreibe einen Kommentar Antwort abbrechen

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros. Kommentare abseits des Themas bitte unter Diskussion. Kommentare, die gegen die Regeln verstoßen, werden rigoros gelöscht. Wegen Missbrauchs bin ich gezwungen, Name und E-Mail als Pflichtfelder beim Kommentieren zu aktivieren. Wählt ggf. einen (noch nicht benutzten) Alias-Namen und verwendet ggf. eine Dummy-Mail-Adresse (z.B. t@hotkev.com).

Du findest den Blog gut, hast aber Werbung geblockt? Du kannst diesen Blog auch durch eine Spende unterstützen.

Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren

Explosion der KI-Token-Kosten

Caveman soll KI-Token-Verbrauch reduzieren

17 Kommentare zu Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren

Schreibe einen Kommentar Antwort abbrechen

Translate

Suchen

Blogs auf Borncity

Spenden und Sponsoren

Aus dem DNV-Netzwerk

Links

Amazon

Awards

Blogroll

Soziale Netzwerke-Seiten

Foren

Neueste Kommentare