GPT-5.4 在電腦使用、網頁瀏覽、知識工作任務和代理工具使用方面的基準測試表現優於 Claude Opus 4.6 👀 是時候試試了