TokenDiet
Mätbara token-besparingar

TokenDiet

Ärliga token-besparingar för kodande AI-agenter.

TokenDiet är en lokal proxy mellan din kod-agent och AI-modellen. Vi minskar tokens, respekterar prompt-cachen och visar exakt vad du sparar — utan att din kod lämnar din maskin.

Vi öppnar nu för closed beta — var med från start.

Bevisat

riktiga benchmarks, inte marknadsföringssiffror

Cache-säker

bryter aldrig Anthropics prompt-cache

Lokalt

din kod lämnar aldrig din maskin

Varför TokenDiet?

Tre saker konkurrenterna inte gör.

Mätbara siffror, inte påståenden

Konkurrenter lovar 50–95% besparing — utan parade körningar på riktiga agent-arbetsflöden där prefix-cachen kan stjälpa siffrorna. Vi publicerar parade benchmark-körningar med standardavvikelse, cache-statistik och OTEL-telemetri. Vad du ser är vad du får.

Cache-säker design

Anthropics prompt-cache är byte-adresserad. Naiv komprimering förstör cachen och gör allt dyrare. TokenDiet är byggt så att vi aldrig muterar en cachad prefix mitt i en session — varje kompressor lever inom samma säkerhetskontrakt.

Lokalt på din maskin

TokenDiet kör som en proxy lokalt. Endast aggregerad statistik lämnar din maskin. Ingen kod, inga prompts, inga hemligheter går till oss eller någon annan. GDPR och NIS2 by design.

Vem är det för?

Byggt för utvecklare som faktiskt använder kod-agenter.

Utvecklare

När $200/månaden inte räcker

Du har slagit i takgränsen eller fått din första överraskningsfaktura från din kod-agent. TokenDiet skär ner tokens utan att förändra ditt arbetsflöde — en proxy, ingen IDE-bytning.

Team-lead

Översikt över teamets AI-spend

Se vad varje utvecklare faktiskt använder, vilka agenter som kostar mest, och var besparingar faktiskt uppstår. Riktiga siffror, inte marknadsföringspåståenden.

Säkerhetsmedveten org

Kod som inte lämnar maskinen

Cloud-baserade kompressions-API:er kräver att du skickar dina prompts till en tredjepartstjänst. TokenDiet kör lokalt. För regulerade branscher, EU-företag, eller team med IP-känslig kod är det här skillnaden mellan ja och nej.

Så fungerar det

En proxy. En CLI. Noll konfiguration.

01

Installera

npx tokendiet start — kör som vanlig process i terminalen. Ingen daemon, inget systemkonto, inget i molnet.

02

Peka din kod-agent på proxyn

Sätt HTTP_PROXY på din befintliga kod-agent. Inget byte av verktyg, ingen ny IDE.

03

Se besparingarna live

Live-utskrift i terminalen visar sparade tokens, kostnad och cache-träffar per anrop. Inga svarta lådor.

tokendiet

$ npx tokendiet start --org-token tk_***

→ proxy listening on http://127.0.0.1:8765

→ set HTTP_PROXY=http://127.0.0.1:8765 in your coding agent

···

[call 14] POST /v1/messagesin 18,420 17,318 (−6.0%)

cache_read 14,902 · cache_write 0 · busts 0saved $0.0024

···

session totals35 calls · −6.7% cached tokens · 0 busts

Riktiga benchmarks

Vad mätningen faktiskt visar.

Vi kör parade benchmark-körningar — samma uppgift, en gång baseline och en gång genom TokenDiet — på riktiga utvecklingsworkloads. Här är två publika sviter.

Så mäter vi

Varje siffra på den här sidan kommer från parade benchmark-körningar:

  1. 01Vi väljer en konkret utvecklingsuppgift i en riktig kodbas — t.ex. fixa en bug i ett TypeScript-projekt, eller lägga till en feature i en NestJS-app.
  2. 02Vi låter Claude Code lösa exakt samma uppgift två gånger: en gång direkt mot Anthropic (baseline), och en gång genom TokenDiet. Samma kodbas, samma modell, samma startläge.
  3. 03Vi mäter total kostnad och totalt antal tokens för varje körning, samt hur modellens cache påverkas.
  4. 04Vi kör flera par för att se variansen — en enskild körning säger inget eftersom Claude Code är icke-deterministiskt.
  5. 05Vi verifierar att alla tester går igenom i båda fallen. Sparade tokens med trasig kod är inte besparing.

Råa rapporter (JSON + markdown per körning) finns i repo:t. Inget cherry-picking — både goda och mindre goda resultat publiceras.

Suite 1ATypeScript bug-fix · 6 anrop

Mäter: kostnad

Kostnad utan TokenDiet$0.176
Kostnad med TokenDiet$0.169
Besparing4.2%
Cache-säker (ingen påverkan på modellens cache)
Tester godkända6/6
Suite 2ANestJS feature-add · 35 anrop

Mäter: tokens (på långa sessioner varierar kostnaden för mycket för att mätas exakt — fler körningar pågår)

Tokens sparade per körning~110K
Cache-säker (ingen påverkan på modellens cache)
Tester godkända41/41

Siffrorna är mindre än konkurrenternas marknadsföringspåståenden men större än deras verkliga mätningar. Tre av sju planerade kompressorer är levererade idag — mer kommer.

Bonus-effekt

Varje sparad token är energi som inte förbrukades.

AI-inferens beräknas nå $15 miljarder per år i slutet av 2026. Bakom varje token finns ett datacenter och en elräkning. TokenDiet är primärt ett verktyg för att spara pengar — men varje besparing översätts direkt till mindre energi och CO₂. Bra för budgeten, bra för planeten.

Kontakt

Redo att se vad du faktiskt spenderar?

Hör av dig om du vill vara med i closed beta, jobbar i ett team som vill se sin AI-spend, eller bara vill prata token-ekonomi.

hello@tokendiet.se