Jak jsme postupovali:
NotebookLM jsem nakrmil FIDE rating regulations a s jeho pomocí z něj vydestiloval detailní specifikaci kalkulačky (trvalo to déle než psaní promptu a generování kódu, a když jsem to dodělal, říkal jsem si, že bych to možná měl rychleji ručně, ale šlo i o princip – co všechno můžu delegovat na AI?).
Výslednou dokumentací jsem přes Antigravity nakrmil Claude a šel si dát kafe.
Měl hotovo dříve než jsem ho dopil, kalkulačka byla funkční na první pokus a vůbec nevypadala špatně (schválně jsem nespecifikoval žádný UI design). Pak přišla na řadu fáze kontrol a drobného vylepšování vzhledu (perfekcionismus si nedal pokoj ani v neděli). A fáze důvěřuj, ale prověřuj – zatímco já jsem si k obrazu svému ohýbal drobnosti v CSSku, Claude Opus porovnával FIDE regulace, specku a kalkulačku. Výsledek? Dvě drobnosti chyběly (rozdíl ratingů přes 400 bodů se ve výpočtu zastropuje; K faktor 40 pro juniory platí jen do ELO 2300 – ne donekonečna). To mě trochu zklamalo (ve specce to bylo), ale abych nebyl na Claude příliš tvrdý – bylo to rychlé pokusné workflow, jeden agent (žádný swarm).
Celá akce (jejímž výsledkem je jeden HTML soubor, který výpočet obstarává JavaScriptem, takže si ho klidně můžete stáhnout a používat offline) nakonec zabrala cca 3 hodiny i s vystavením na našem webu. Nejdéle trvalo to drobné estetické ladění – úkoly tak triviální, že popsat je do promptu trvá déle než je udělat manuálně a úkoly, které bych dělat nemusel, kdybych na začátku připravil alespoň draft UI.
A pak jsem udělal jinou věc: vzal jsem koncept minihry (o té možná příště), který jsem začal chystat o Vánocích stylem definice základních principů a postupného vylepšování po jednotlivých krocích. Co nejjednodušším způsobem ho popsal a nechal Claude pracovat na „nové implementaci" (aniž by četl tu starou). Výsledek byla tragédie. Proč? Myslím, že proto, že stále platí garbage in => garbage out. Odfláknutým zadáním jsem dostal odfláknutou aplikaci...
A proč to celé píšu?
Zdá se mi, že čas (mikro)aplikací na míru (ať už pro soukromou potřebu či pro potřebu firmy) skutečně přichází. Začíná mít smysl automatizovat věci, u kterých by psaní automatizace ručně nemělo šanci se zaplatit. Je ale třeba nezapomínat na tři věci:
- Výsledek nebude nikdy lepší než vaše zadání.
- Bezpečnost je něco, co se ex post řeší dost špatně. A nezřídka může být na její doplňování už pozdě.
- Pokud kód, který vám vypadl, nečtete, nevíte jestli to krom toho co dělat má nedělá i něco co dělat nemá. Jste na tenkém ledě.
A co vy? Jak to vidíte? Máte nějakou svou „aplikaci", kterou jste vlastně nenapsali? Máte problém nebo úkol, který si „o to říká", ale nevíte, jak se do něj pustit?
Dejte vědět.