É interessante que o código do Claude tenha um desempenho melhor do que o do Codex neste exercício. Temos achado que são aproximadamente semelhantes, mas as nossas tarefas são bastante diferentes! @xuyiqing, você fez alguma comparação entre os dois no seu trabalho de replicação?