LTX-2.3 adalah peningkatan besar. Ini adalah mesin multimoda siap produksi - dirancang untuk dibangun. Inilah yang baru 🧵 1/7
Pengiriman hari ini: → Kode lengkap, bobot model, dan kode pelatihan → Akses API untuk integrasi produksi → LTX Studio untuk pembuatan berbasis web Jalankan secara lokal. Sempurnakan. Integrasikan langsung ke dalam alur kerja Anda. 2/7
Peningkatan terbesar adalah kesetiaan visual dan stabilitas gerak. VAE video baru dan ruang laten yang disempurnakan menghadirkan detail halus yang lebih tajam dan gerakan yang lebih stabil. Gambar-ke-video menyatukan dengan lebih baik, tekstur kecil bertahan dari kompresi, dan interpolasi bingkai terakhir membuat akhir terasa disengaja. Kami juga menerapkan pemfilteran data yang lebih agresif dan pemrosesan data yang lebih baik, yang secara langsung meningkatkan detail visual halus dan mengurangi artefak. 3/7
Pemahaman yang cepat juga mengambil langkah maju yang nyata. Konektor teks yang lebih besar meningkatkan cara model menafsirkan gerakan kamera, komposisi pemandangan, dan tindakan karakter. Anda tidak perlu lagi merekayasa perintah secara berlebihan untuk mendapatkan hasil yang dapat diprediksi. Di bawah tenda, normalisasi adaptif dan perhatian terjaga keamanannya memperketat kontrol tanpa meningkatkan kerumitan. 4/7
Bingkai utama dan kontrol terstruktur sekarang terintegrasi lebih dalam. LTX-2.3 dilatih dengan tujuan multi-tugas dari tahap prapelatihan, termasuk gambar-ke-video, pengambilan ulang, bingkai utama, dan banyak lagi. Hal ini membuat transisi, evolusi adegan terkontrol, dan alur kerja multi-bidikan lebih konsisten dan andal. 5/7
Kualitas audio juga meningkat secara keseluruhan. Vocoder baru meningkatkan kejernihan dialog dan realisme suara. Penyelarasan lintas modal antara audio dan video lebih ketat. Pemfilteran yang lebih kuat dan pemrosesan data yang ditingkatkan mengurangi output yang berisik dan meningkatkan kesetiaan audio secara keseluruhan. 6/7
133