{"id":327085,"date":"2026-07-02T09:36:51","date_gmt":"2026-07-02T07:36:51","guid":{"rendered":"https:\/\/borncity.com\/blog\/?p=327085"},"modified":"2026-07-03T08:43:43","modified_gmt":"2026-07-03T06:43:43","slug":"plugin-caveman-soll-token-kosten-bei-ai-nutzung-reduzieren","status":"publish","type":"post","link":"https:\/\/borncity.com\/blog\/2026\/07\/02\/plugin-caveman-soll-token-kosten-bei-ai-nutzung-reduzieren\/","title":{"rendered":"Plugin Caveman soll Token-Kosten bei AI-Nutzung reduzieren"},"content":{"rendered":"<p><img decoding=\"async\" style=\"float: left; margin: 0px 10px 0px 0px; display: inline;\" src=\"https:\/\/borncity.com\/blog\/wp-content\/uploads\/2024\/10\/DNxhm89.jpg\" alt=\"\" align=\"left\" \/>Die Token-Kosten f\u00fcr die Nutzung von KI-Angeboten explodieren geradezu, seit die Anbieter diese nach Verbrauch abrechen. Ein Entwickler hat das Plugin Caveman ver\u00f6ffentlicht, welches die Nutzung von Tokens minimieren soll.<\/p>\n<p><!--more--><\/p>\n<h2>Explosion der KI-Token-Kosten<\/h2>\n<p><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/vg09.met.vgwort.de\/na\/7b12a14f67164e389f3433c66b54aabd\" alt=\"\" width=\"1\" height=\"1\" \/>Ich hatte Anfang Juni 2026 im Beitrag\u00a0<a href=\"https:\/\/borncity.com\/blog\/2026\/06\/06\/zerschellt-der-ki-traum-an-den-gigantischen-token-kosten\/\">Zerschellt der KI-Traum an den gigantischen (Token-)Kosten?<\/a> \u00fcber die Explosion der Token-Kosten f\u00fcr die KI-Nutzung berichtet. Das autonome Taxi-Unternehmen Uber hat sein KI-Jahresbudget f\u00fcr 2026 in einem Monat verbrannt.<\/p>\n<p>Accenture stellte laut nachfolgendem Tweet fest, dass ein Gro\u00dfteil seiner \"explodierenden Token-Kosten\" darauf zur\u00fcckzuf\u00fchren war, dass Mitarbeiter PDFs in Pr\u00e4sentationen umwandelten.\u00a0Weiterhin wurde von einem Unternehmen berichtet, welches 500 Millionen US-Dollar an Token-Kosten binnen eines Monats angeh\u00e4uft hat. Meinen Informationen nach war dies Amazon, wo die Belegschaft vor Monaten noch angehalten wurde, KI \"auf Teufel komm raus zu nutzen\".<\/p>\n<p>Firmen reduzieren inzwischen die Nutzung der KI durch ihre Mitarbeiter. Microsoft hat die Verwendung von Claude Code f\u00fcr Entwickler extrem eingeschr\u00e4nkt und stellt diesen Copilot als Alternative bereit. Der Traum von der breiten AI-Nutzung verpufft gerade. Und erste Firmen werfen Mitarbeiter raus, um ihre KI-Rechnungen nach bezahlen zu k\u00f6nnen.<\/p>\n<p>Ed Zitron deutet in <a href=\"https:\/\/xcancel.com\/edzitron\/status\/2070235192300867900\" target=\"_blank\" rel=\"noopener\">diesem Tweet<\/a> an, dass die Abrechnung der KI-Kosten f\u00fcr viele Unternehmen ziemlich undurchsichtig ist und diese nicht wissen, wof\u00fcr sie KI \u00fcberhaupt einsetzen. KPMG hat diesen \"Blindflug\" bez\u00fcglich der Kosten in einer Analyse offen gelegt. Ich hatte dies im Beitrag <a href=\"https:\/\/borncity.com\/blog\/2026\/06\/09\/firmen-haben-keine-kontrolle-ueber-ihre-ai-kosten\/\" target=\"_blank\" rel=\"noopener\">Firmen haben keine Kontrolle \u00fcber ihre AI-Kosten<\/a> angesprochen.<\/p>\n<p>Und Gartner prognostiziert, dass die KI-Token-Kosten im Jahr 2028 die Geh\u00e4lter der sie nutzenden Entwickler \u00fcbersteigen werde. heise hat das beispielsweise in <a href=\"https:\/\/www.heise.de\/news\/Prognose-2028-wird-KI-Coding-teurer-als-Entwicklergehaelter-11343464.html\" target=\"_blank\" rel=\"noopener\">diesem Artikel<\/a> aufgegriffen. Die Firmen werden sich da also etwas in Bezug auf die KI-Nutzung bei der Entwicklung von Software \u00fcberlegen m\u00fcssen. Ich sehe auf X in den letzten Wochen h\u00e4ufiger Meldungen, wo Software-Entwickler den Einsatz von KI stark zur\u00fcck fahren oder sogar g\u00e4nzlich einstellen, da die Erwartungen nicht erf\u00fcllt wurden.<\/p>\n<h2>Caveman soll KI-Token-Verbrauch reduzieren<\/h2>\n<p>Jede Ma\u00dfnahme, die den Token-Verbrauch reduziert, wirkt sich also sofort auf die Kosten aus. Ich bin \u00fcber nachfolgenden Tweet auf einen entsprechenden Sachverhalt aufmerksam geworden: Ein Plugin, welches den KI-Token-Verbrauch reduzieren soll.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-327086\" src=\"https:\/\/borncity.com\/blog\/wp-content\/uploads\/2026\/07\/Caveman.jpg\" alt=\"Caveman AI-Token-Minimizer\" width=\"599\" height=\"439\" srcset=\"https:\/\/borncity.com\/blog\/wp-content\/uploads\/2026\/07\/Caveman.jpg 599w, https:\/\/borncity.com\/blog\/wp-content\/uploads\/2026\/07\/Caveman-300x220.jpg 300w\" sizes=\"auto, (max-width: 599px) 100vw, 599px\" \/><\/p>\n<p>Das\u00a0Plugin <em>\"caveman\"<\/em> (H\u00f6hlenmensch) soll KI-Tools zwingen, Artikel, F\u00fcllw\u00f6rter und H\u00f6flichkeitsfloskeln aus ihren vom LLM generierten Antworten zu entfernen, um die Token-Kosten zu senken. Bei Claude Code soll das bis zu 65% Token-Einsparung bringen, hei\u00dft es.<\/p>\n<p>Die Eigenbeschreibung lautet, dass das Plugin f\u00fcr Claude-Code sowie weitere AI-Produkte wie Codex, Gemini, Cursor, Windsurf, Cline, Copilot und \u00fcber 30 weitere die Anzahl der ben\u00f6tigten KI-Tokens um ca. 75 % reduziert und trotzdem die volle technische Genauigkeit der Anfragen bewahrt. Die an die LLMs gestellten Prompts werden dazu entsprechend vor dem Absenden um die oben angesprochenen Inhalte und Floskeln bereinigt.<\/p>\n<p>Ein leitender Mitarbeiter von OpenAI habe dabei geholfen, ein Tool zu entwickeln, das die Nutzung des eigenen Produkts von OpenAI kosteng\u00fcnstiger macht, hei\u00dft es in obigem Tweet. Das Tool hat 54.000 Sterne auf GitHub und Entwickler bei OpenAI, Nvidia und GitHub sollen das Plugin bereits nutzen.\u00a0Das Plugin Caveman wird von Julius Brussee auf <a href=\"https:\/\/github.com\/juliusbrussee\/caveman\" target=\"_blank\" rel=\"noopener\">GitHub angeboten<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Token-Kosten f\u00fcr die Nutzung von KI-Angeboten explodieren geradezu, seit die Anbieter diese nach Verbrauch abrechen. Ein Entwickler hat das Plugin Caveman ver\u00f6ffentlicht, welches die Nutzung von Tokens minimieren soll.<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[8625,7459,143],"tags":[8382,3836,4351,15619],"class_list":["post-327085","post","type-post","status-publish","format-standard","hentry","category-ai","category-software","category-tipps","tag-ai","tag-software","tag-tipp","tag-token"],"_links":{"self":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/327085","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/comments?post=327085"}],"version-history":[{"count":5,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/327085\/revisions"}],"predecessor-version":[{"id":327112,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/posts\/327085\/revisions\/327112"}],"wp:attachment":[{"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/media?parent=327085"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/categories?post=327085"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/borncity.com\/blog\/wp-json\/wp\/v2\/tags?post=327085"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}