Ärliga token-besparingar för kodande AI-agenter.
TokenDiet är en lokal proxy mellan din kod-agent och AI-modellen. Vi minskar tokens, respekterar prompt-cachen och visar exakt vad du sparar — utan att din kod lämnar din maskin.
Vi öppnar nu för closed beta — var med från start.
Bevisat
riktiga benchmarks, inte marknadsföringssiffror
Cache-säker
bryter aldrig Anthropics prompt-cache
Lokalt
din kod lämnar aldrig din maskin
Varför TokenDiet?
Konkurrenter lovar 50–95% besparing — utan parade körningar på riktiga agent-arbetsflöden där prefix-cachen kan stjälpa siffrorna. Vi publicerar parade benchmark-körningar med standardavvikelse, cache-statistik och OTEL-telemetri. Vad du ser är vad du får.
Anthropics prompt-cache är byte-adresserad. Naiv komprimering förstör cachen och gör allt dyrare. TokenDiet är byggt så att vi aldrig muterar en cachad prefix mitt i en session — varje kompressor lever inom samma säkerhetskontrakt.
TokenDiet kör som en proxy lokalt. Endast aggregerad statistik lämnar din maskin. Ingen kod, inga prompts, inga hemligheter går till oss eller någon annan. GDPR och NIS2 by design.
Vem är det för?
Du har slagit i takgränsen eller fått din första överraskningsfaktura från din kod-agent. TokenDiet skär ner tokens utan att förändra ditt arbetsflöde — en proxy, ingen IDE-bytning.
Se vad varje utvecklare faktiskt använder, vilka agenter som kostar mest, och var besparingar faktiskt uppstår. Riktiga siffror, inte marknadsföringspåståenden.
Cloud-baserade kompressions-API:er kräver att du skickar dina prompts till en tredjepartstjänst. TokenDiet kör lokalt. För regulerade branscher, EU-företag, eller team med IP-känslig kod är det här skillnaden mellan ja och nej.
Så fungerar det
01
npx tokendiet start — kör som vanlig process i terminalen. Ingen daemon, inget systemkonto, inget i molnet.
02
Sätt HTTP_PROXY på din befintliga kod-agent. Inget byte av verktyg, ingen ny IDE.
03
Live-utskrift i terminalen visar sparade tokens, kostnad och cache-träffar per anrop. Inga svarta lådor.
$ npx tokendiet start --org-token tk_***
→ proxy listening on http://127.0.0.1:8765
→ set HTTP_PROXY=http://127.0.0.1:8765 in your coding agent
···
[call 14] POST /v1/messagesin 18,420 → 17,318 (−6.0%)
cache_read 14,902 · cache_write 0 · busts 0saved $0.0024
···
session totals35 calls · −6.7% cached tokens · 0 busts
Riktiga benchmarks
Vi kör parade benchmark-körningar — samma uppgift, en gång baseline och en gång genom TokenDiet — på riktiga utvecklingsworkloads. Här är två publika sviter.
Varje siffra på den här sidan kommer från parade benchmark-körningar:
Råa rapporter (JSON + markdown per körning) finns i repo:t. Inget cherry-picking — både goda och mindre goda resultat publiceras.
Mäter: kostnad
Mäter: tokens (på långa sessioner varierar kostnaden för mycket för att mätas exakt — fler körningar pågår)
Siffrorna är mindre än konkurrenternas marknadsföringspåståenden men större än deras verkliga mätningar. Tre av sju planerade kompressorer är levererade idag — mer kommer.
Bonus-effekt
AI-inferens beräknas nå $15 miljarder per år i slutet av 2026. Bakom varje token finns ett datacenter och en elräkning. TokenDiet är primärt ett verktyg för att spara pengar — men varje besparing översätts direkt till mindre energi och CO₂. Bra för budgeten, bra för planeten.
Kontakt
Hör av dig om du vill vara med i closed beta, jobbar i ett team som vill se sin AI-spend, eller bara vill prata token-ekonomi.
hello@tokendiet.se