O benchmarking do GPT-5.4 é melhor do que o do Claude Opus 4.6 em uso de computador, navegação na web, tarefas de trabalho de conhecimento e uso de ferramentas de agentes 👀 Hora de experimentar