GPT-5.4 benchmarking je lepší než Claude Opus 4.6 v používání počítačů, prohlížení webu, znalostních úkolech a používání 👀 nástrojů agentů Čas to vyzkoušet