Toinen ratkaisematon (ja myönnettäköön vaikea) tekoälyn vertailuarvo: "kirjoita tyydyttävä 10 kappaleen murhamysteeri. Palaset, joita tarvitset mysteerin ratkaisemiseen, tulisi olla tarpeeksi selkeitä ensimmäisissä viidessä kappaleessa, jotta sen voisi ratkaista, mutta tarpeeksi hämäriä, jotta suurin osa ihmisistä ei pysty" Virheet paljastavat: -Claude unohtaa lisätä varsinaisen vihjeen pulmaan (ja yksityiskohdat ovat liian epäselviä), klassinen suunnitteluongelma LLM:ille, eikä Coworkin tai koodin käyttäminen auta. -ChatGPT 5.4 Pro luo täysin ilmeisen vihjeen ja jatkaa sitten kirjoittamista monimutkaisilla metaforilla ja monimutkaisuuksilla, jotka ovat vaivanneet ChatGPT-fiktiota. Pro pärjäsi kuitenkin paremmin kuin Thinking. -Gemini 3.1 Pro on lähimpänä, mutta jää on vähän ilmeinen, ja se täysin sotkee sille, miksi jääjuttu oli tärkeä.