Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
LTX-2.3 es una actualización importante.
Es un motor multimodal listo para producción, diseñado para ser construido sobre él.
Aquí está lo nuevo 🧵
1/7
Envío hoy:
→ Código completo, pesos del modelo y código de entrenamiento
→ Acceso a la API para integración en producción
→ LTX Studio para generación basada en la web
Ejecuta localmente. Ajusta finamente. Integra directamente en tus flujos de trabajo.
2/7
La mayor mejora es la fidelidad visual y la estabilidad del movimiento.
Un nuevo video VAE y un espacio latente refinado ofrecen un detalle fino más nítido y un movimiento más estable.
La conversión de imagen a video se mantiene mejor, las texturas pequeñas sobreviven a la compresión y la interpolación del último fotograma hace que los finales se sientan intencionados.
También aplicamos un filtrado de datos más agresivo y mejoramos el procesamiento de datos, lo que mejora directamente el detalle visual fino y reduce los artefactos.
3/7
La comprensión de los prompts también ha dado un paso real hacia adelante.
Un conector de texto más grande mejora la forma en que el modelo interpreta el movimiento de la cámara, la composición de la escena y las acciones de los personajes.
Ya no necesitas sobre-ingenerizar los prompts para obtener resultados predecibles.
Bajo el capó, la normalización adaptativa y la atención controlada ajustan el control sin aumentar la complejidad.
4/7
Los fotogramas clave y el control estructurado están ahora más integrados.
LTX-2.3 se entrena con objetivos de múltiples tareas desde la etapa de preentrenamiento, incluyendo imagen a video, regrabación, fotogramas clave y más.
Esto hace que las transiciones, la evolución controlada de escenas y los flujos de trabajo de múltiples tomas sean más consistentes y fiables.
5/7
La calidad de audio también ha mejorado en todos los aspectos.
Un nuevo vocoder aumenta la claridad del diálogo y el realismo del sonido. La alineación entre audio y video es más precisa.
Un filtrado más fuerte y un procesamiento de datos mejorado reducen las salidas ruidosas y mejoran la fidelidad general del audio.
6/7
59
Parte superior
Clasificación
Favoritos
