LTX-2.3 — это крупное обновление. Это готовый к производству многомодальный движок — предназначенный для дальнейшей разработки. Вот что нового 🧵 1/7
Доставка сегодня: → Полный код, веса модели и код обучения → Доступ к API для интеграции в производство → LTX Studio для веб-генерации Запустите это локально. Настройте под себя. Интегрируйте это непосредственно в ваши рабочие процессы. 2/7
Самое большое обновление — это визуальная четкость и стабильность движения. Новая видеомодель VAE и усовершенствованное латентное пространство обеспечивают более четкие детали и более стабильное движение. Переход от изображения к видео лучше сохраняется, мелкие текстуры выдерживают сжатие, а интерполяция последнего кадра делает концовки более осмысленными. Мы также применили более агрессивную фильтрацию данных и улучшили обработку данных, что напрямую улучшает визуальные детали и уменьшает артефакты. 3/7
Понимание подсказок также сделало реальный шаг вперед. Более крупный текстовый коннектор улучшает то, как модель интерпретирует движение камеры, композицию сцены и действия персонажей. Теперь вам не нужно чрезмерно усложнять подсказки, чтобы получить предсказуемые результаты. Внутри адаптивная нормализация и управляемое внимание усиливают контроль без увеличения сложности. 4/7
Ключевые кадры и структурированный контроль теперь более глубоко интегрированы. LTX-2.3 обучен с многоцелевыми задачами на этапе предварительного обучения, включая преобразование изображений в видео, пересъемку, ключевые кадры и многое другое. Это делает переходы, контролируемую эволюцию сцен и многошотные рабочие процессы более последовательными и надежными. 5/7
Качество звука также улучшилось во всех аспектах. Новый вокодер повышает четкость диалогов и реалистичность звука. Кросс-модальное согласование между аудио и видео стало более точным. Улучшенная фильтрация и обработка данных снижают уровень шума и повышают общую аудиофиделити. 6/7
59