El modelo indio Sarvam-105b es realmente muy bueno Sarvam AI ha abierto el código de dos modelos de razonamiento construidos en India, Sarvam 30B y 105B, posicionándolos como modelos abiertos competitivos a nivel global. El gran desbloqueo no son solo las puntuaciones de referencia como 98.6 en Math500 para 105B o la fuerte eficiencia de implementación local para 30B, sino la historia completa: datos internos, entrenamiento, RL, diseño de tokenizadores y optimización de inferencias construidos tanto para GPUs de vanguardia como para dispositivos de consumo.