O uso do Trinity, especialmente quando é gratuito no openrouter, tem sido incrível. Na verdade, conseguimos lidar com 3 vezes mais throughput no nosso cluster de inferência do que estimávamos. Mas nosso TPS despencou conforme o uso continua crescendo. Transferimos um pouco do processamento de treinamento para inferência (não tão simples quanto eu imaginava) e devemos voltar à velocidade máxima. Dê tudo que você tem.