AI nástroje pro vývojáře se v posledních měsících skokově zlepšily. GPT-5, Gemini 2.5 a čerstvě i Sonnet 4.5 přinášejí nové možnosti, jak automatizovat rutinní úkoly při psaní kódu. Kdo neprogramuje, možná si toho ani nevšimne. Ale rozdíl je obrovský.
Naopak jiné schopnosti, třeba psaní e-mailů nebo odpovědí v chatu, se zlepšují pomaleji. I když se modely vyvíjejí, pro uživatele to často neznamená žádnou znatelnou změnu. AI sice postupuje kupředu, ale ne rovnoměrně.
The Reinforcement Gap — or why some AI skills improve faster than others
— Evan Kirstel #B2B #TechFluencer (@EvanKirstel) October 5, 2025
AI coding tools are getting better fast. If you don’t work in code, it can be hard to notice how much things are changing, but GPT-5 and Gemini 2.5 have made a whole new set of developer tricks possible… pic.twitter.com/t4ticxydgf
Kód má jasné měřítko
Za nerovnoměrným vývojem stojí především posilované učení, tedy reinforcement learning (RL). To umožňuje modelům učit se opakováním, ideálně tam, kde je snadné změřit, co je správně a co špatně. A právě psaní kódu je pro to ideální disciplína.
Každý program se totiž už dnes testuje, na chyby, výkon, bezpečnost. A přesně tyto testy využívají i AI modely. „Testování, které slouží vývojářům, se ukázalo stejně cenné pro učení umělé inteligence,“ říká šéf vývojářských nástrojů v Googlu.
Oproti tomu dobrý e-mail nebo povedenou odpověď v chatu nikdo snadno neotestuje. Neexistuje na to jasný metr, každý čtenář může hodnotit jinak. RL se tu uplatní hůř a zlepšení tak přichází pomaleji, často jen kosmetická.
Rozdíl mezi testovatelnými a netestovatelnými dovednostmi se proto prohlubuje. A stává se klíčovým faktorem v tom, jaké AI produkty vznikají a jak rychle se zlepšují. Tzv. reinforcement gap začíná být jedním z hlavních limitů vývoje.
Testovatelnost rozhoduje
Ne všechno ale musí zůstat netestovatelné. U čtvrtletních finančních výkazů nebo aktuálníchch analýz si možná zatím nevystačíme s hotovou sadou testů, ale s dostatkem peněz a chytrým přístupem by to šlo změnit.
Kdo dokáže vytvořit dobré testy, ten může vytvořit i použitelný AI nástroj. A právě testovatelnost procesu bude rozhodovat, jestli se z nápadu stane produkt, nebo jen efektní demo.
Zajímavý vývoj nastává i u oblastí, které dřív vypadaly jako netestovatelné, třeba generování videa. Nový model Sora 2 od OpenAI ukazuje, že i zde může RL výrazně pomoci. Výsledná videa mají stabilní objekty, věrohodnou fyziku a působí reálně.
To naznačuje, že i tam, kde to dosud nešlo, může posilované učení nakonec najít cestu. A s ním i další pokrok, který by mohl překvapit dřív, než čekáme.