Další nevyřešený (a přiznávám, že těžký) ukazatel AI: "napište uspokojivou detektivku na 10 odstavců. Části, které potřebujete k vyřešení záhady, by měly být dostatečně jasné v prvních pěti odstavcích, abyste je mohli vyřešit, ale dost nejasné, aby většina lidí to neudělala." Chyby odhalují: -Claude zapomíná přidat skutečnou nápovědu do hádanky (a detaily jsou příliš nejasné), což je klasický plánovací problém pro LLM, a ne, používání Coworku nebo Kódu tomu nepomáhá. -ChatGPT 5.4 Pro vytváří zcela zřejmou stopu a pak pokračuje v psaní s přehnaně propracovanými metaforami a komplikacemi, které pronásledují fikci ChatGPT. Pro si ale vedl lépe než Thinking. -Gemini 3.1 Pro je nejblíž, ale led je trochu nápadný a úplně to pokazí vysvětlení, proč bylo ledové řešení důležité.