Preskoči na sadržaj

Caveman skill je sada još bitniji jer Copilot naplaćuje po tokenima

GitHub prebacuje Copilot na naplatu po potrošnji. Kombinacija caveman skill-a i grill-me planiranja drži output jeftinim, a nameru jasnom.

  • ai-tools
  • github-copilot
  • workflow

GitHub je najavio da Copilot prelazi na naplatu po potrošnji od 1. juna 2026. Cene licenci ostaju iste, ali rad agenata više nije švedski sto po fiksnoj ceni. Premium request jedinice nestaju. GitHub AI krediti se troše na osnovu potrošnje tokena: input, output i keširani tokeni, naplaćeni po API ceni svakog modela.

To menja računicu za svakoga ko vrti duge agent sesije. Kratak chat i višesatno krčenje po repou su koštali isto u starom premium-request modelu. Uskoro više neće. Pravac proizvoda je jasan: agentic coding je default, a cena inference-a prati potrošnju.

Već neko vreme koristim dva skill-a koja se odlično uklapaju u ovu promenu: caveman za komprimovane odgovore i grill-me za planiranje pre koda.

Zašto output tokeni odjednom postaju bitni

Većina saveta oko AI kodiranja se i dalje vrti oko prompt-ova i context window-a. To je pola računa.

Sa naplatom po potrošnji, brbljivi agenti nisu samo iritantni. Oni su skupi. Svaki uvod, rezime i pasus tipa “I’d be happy to help” je naplaćeni output. Isto važi i za svaki dugačak summary implementacije kad bi kratak bio sasvim dovoljan.

Caveman skill napada baš tu stranu. Govori agentu da izbaci filer, zadrži tehničku suštinu i odgovara u kratkim fragmentima. Benchmark-ovi samog projekta tvrde otprilike 65-75% manje output-a na uporedivim zadacima bez gubitka tačnosti. Rezultati će varirati od modela do modela i od sesije do sesije, ali pravac je dobar: smanji ono što agent priča, ne ono što ume.

Instalira se isto kao i ostali agent skill-ovi:

npx skills@latest add JuliusBrussee/caveman -a github-copilot

Za Cursor ili always-on pravilo na nivou celog repoa:

npx skills@latest add JuliusBrussee/caveman -a cursor --with-init

Zameni -a flag za editor ili CLI koji koristiš. Installer mapira skill u nativni format svakog alata (Copilot instructions, Cursor rules, Claude plugin i tako dalje).

Caveman ne zamenjuje dobru arhitekturu ni testove. On smanjuje potrošnju tokena na strani odgovora. A upravo to će ti Copilot sa naplatom po potrošnji naplaćivati u svakom turn-u.

Prvo grilovanje, pa onda kratka priča

Sam caveman bi ti i dalje dozvolio da spališ kredite na pogrešan posao. Štur agent koji implementira pogrešan feature je jeftin šum.

Tu uskače grill-me. Pisao sam o ovom obrascu u AI-assisted coding needs smaller loops: nateraj agenta da te intervjuiše pre nego što pipne repo. Jedno pitanje po jedno. Oblik proizvoda, edge case-ovi, data model, načini na koje stvari mogu da puknu. Mutna namera postaje dizajn koji možeš da pregledaš.

Instalacija iz kolekcije skill-ova Matt Pocock-a:

npx skills@latest add mattpocock/skills

Zatim pozovi grill-me (ili ekvivalentan prompt) na početku feature-a. Agent troši tokene na pitanja i odluke unapred, umesto na velike pogrešne diff-ove kasnije.

Zajedno, petlja izgleda ovako:

  1. Grill-me forsira duboko planiranje i zajedničko razumevanje pre implementacije.
  2. Caveman drži svaki odgovor kratkim kad kodiranje krene, pa output tokeni ostaju niski tokom duge sesije.

Ti planiraš u punim rečenicama ako hoćeš. Agent može da odgovara komprimovano. Kvalitet planiranja raste; brbljivost na računu pada.

Šta ovo ne rešava

Caveman komprimuje output agenta, ne tvoje context fajlove, ne svaki tool call i ne input tokene iz ogromnog AGENTS.md ili istorije thread-a. Naplata po potrošnji i dalje kažnjava naduvan kontekst. Kompakcija, vertikalni slice-ovi i čišćenje ustajalih sesija i dalje znače. Pogledaj isti “smaller loops” post za tu stranu workflow-a.

Grill-me dodaje turn-ove na početku. I oni koštaju tokene. Opklada je da jeftinija i preciznija implementacija kasnije isplati taj intervju. Na planovima gde se mere tokeni, tu opkladu je lakše opravdati nego na neograničenim PRU-ovima.

Business i Enterprise korisnici dobijaju zajedničke kredite i budžetske limite od juna, uz promotivne dodatne kredite na nekoliko meseci. Pojedinci na Pro planu dobijaju kredite usklađene sa mesečnom cenom. Ništa od toga ne uklanja podsticaj da trošiš manje tokena po zadatku.

Praktičan stack za Copilot sa naplatom po tokenima

Ako si na Copilot Business ili Enterprise planu kad promena stigne, ovo je razuman default:

  1. Pokreni grill-me (ili svoj planning skill) pre netrivijalnih feature-a.
  2. Uključi caveman da odgovori agenta ostanu zgusnuti tokom implementacije.
  3. Drži zadatke u vertikalnim slice-ovima sa brzim feedback-om (testovi, lint, smoke) da se pogrešni putevi ubiju rano.
  4. Prati preview račun koji GitHub uvodi u maju da vidiš projektovanu potrošnju pre 1. juna.

Caveman deo je namerno memičan. Promena naplate nije. Copilot se sada cenovno ponaša kao API. Skill-ovi koji pooštravaju planiranje i smanjuju output su jeftin način da uskladiš svoj workflow sa tom realnošću.