Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren

Die Token-Kosten für die Nutzung von KI-Angeboten explodieren geradezu, seit die Anbieter diese nach Verbrauch abrechen. Ein Entwickler hat das Plugin Caveman veröffentlicht, welches die Nutzung von Tokens minimieren soll.

Explosion der KI-Token-Kosten

Ich hatte Anfang Juni 2026 im Beitrag Zerschellt der KI-Traum an den gigantischen (Token-)Kosten? über die Explosion der Token-Kosten für die KI-Nutzung berichtet. Das autonome Taxi-Unternehmen Uber hat sein KI-Jahresbudget für 2026 in einem Monat verbrannt.

Accenture stellte laut nachfolgendem Tweet fest, dass ein Großteil seiner "explodierenden Token-Kosten" darauf zurückzuführen war, dass Mitarbeiter PDFs in Präsentationen umwandelten. Weiterhin wurde von einem Unternehmen berichtet, welches 500 Millionen US-Dollar an Token-Kosten binnen eines Monats angehäuft hat. Meinen Informationen nach war dies Amazon, wo die Belegschaft vor Monaten noch angehalten wurde, KI "auf Teufel komm raus zu nutzen".

Firmen reduzieren inzwischen die Nutzung der KI durch ihre Mitarbeiter. Microsoft hat die Verwendung von Claude Code für Entwickler extrem eingeschränkt und stellt diesen Copilot als Alternative bereit. Der Traum von der breiten AI-Nutzung verpufft gerade. Und erste Firmen werfen Mitarbeiter raus, um ihre KI-Rechnungen nach bezahlen zu können.

Ed Zitron deutet in diesem Tweet an, dass die Abrechnung der KI-Kosten für viele Unternehmen ziemlich undurchsichtig ist und diese nicht wissen, wofür sie KI überhaupt einsetzen. KPMG hat diesen "Blindflug" bezüglich der Kosten in einer Analyse offen gelegt. Ich hatte dies im Beitrag Firmen haben keine Kontrolle über ihre AI-Kosten angesprochen.

Und Gartner prognostiziert, dass die KI-Token-Kosten im Jahr 2028 die Gehälter der sie nutzenden Entwickler übersteigen werde. heise hat das beispielsweise in diesem Artikel aufgegriffen. Die Firmen werden sich da also etwas in Bezug auf die KI-Nutzung bei der Entwicklung von Software überlegen müssen. Ich sehe auf X in den letzten Wochen häufiger Meldungen, wo Software-Entwickler den Einsatz von KI stark zurück fahren oder sogar gänzlich einstellen, da die Erwartungen nicht erfüllt wurden.

Caveman soll KI-Token-Verbrauch reduzieren

Jede Maßnahme, die den Token-Verbrauch reduziert, wirkt sich also sofort auf die Kosten aus. Ich bin über nachfolgenden Tweet auf einen entsprechenden Sachverhalt aufmerksam geworden: Ein Plugin, welches den KI-Token-Verbrauch reduzieren soll.

Caveman AI-Token-Minimizer

Das Plugin "caveman" (Höhlenmensch) soll KI-Tools zwingen, Artikel, Füllwörter und Höflichkeitsfloskeln aus ihren vom LLM generierten Antworten zu entfernen, um die Token-Kosten zu senken. Bei Claude Code soll das bis zu 65% Token-Einsparung bringen, heißt es.

Die Eigenbeschreibung lautet, dass das Plugin für Claude-Code sowie weitere AI-Produkte wie Codex, Gemini, Cursor, Windsurf, Cline, Copilot und über 30 weitere die Anzahl der benötigten KI-Tokens um ca. 75 % reduziert und trotzdem die volle technische Genauigkeit der Anfragen bewahrt. Die an die LLMs gestellten Prompts werden dazu entsprechend vor dem Absenden um die oben angesprochenen Inhalte und Floskeln

Ein leitender Mitarbeiter von OpenAI habe dabei geholfen, ein Tool zu entwickeln, das die Nutzung des eigenen Produkts von OpenAI kostengünstiger macht, heißt es in obigem Tweet. Das Tool hat 54.000 Sterne auf GitHub und Entwickler bei OpenAI, Nvidia und GitHub sollen das Plugin bereits nutzen. Das Plugin Caveman wird von Julius Brussee auf GitHub angeboten.

Dieser Beitrag wurde unter AI, Software, Tipps abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen für den Permalink.

Ein Kommentar zu Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren

  1. Chris sagt:

    Quasi der AddBlocker für KI Tools, bin mal gespannt ob da seitens der KI Anbieter vorgegangen wird, schließlich bedeutet eine Reduzierung der KI Tokens um 75% auch ein Umsatzverlust von 75%.

    Auf der anderen Seite, wenn Artikel, Füllwörter und Höflichkeitsfloskeln für 75% des Tokenverbrauchs verantwortlich sind, läuft beim Thema KI und Tokenabrechnung einiges schief. Denn anscheinend wird dann stumpf nach "Anzahl von Zeichen" bei einer Antwort abgerechnet und nicht nach "Rechenaufwand und Stromverbrauch" der wirklichen Aufgabe.

    Die KI Anbieter können so leicht den Umsatz hochschrauben, man gibt der KI vor ausführlicher zu Antworten. Ergänze jede Antwort um 10% mehr Text durch eine ausführliche Antwort, und schon hat man 10% mehr Umsatz.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros. Kommentare abseits des Themas bitte unter Diskussion. Kommentare, die gegen die Regeln verstoßen, werden rigoros gelöscht. Wegen Missbrauchs bin ich gezwungen, Name und E-Mail als Pflichtfelder beim Kommentieren zu aktivieren. Wählt ggf. einen (noch nicht benutzten) Alias-Namen und verwendet ggf. eine Dummy-Mail-Adresse (z.B. t@hotkev.com).

Du findest den Blog gut, hast aber Werbung geblockt? Du kannst diesen Blog auch durch eine Spende unterstützen.