LTX-2.3 este un upgrade major. Este un motor multimodal gata de producție – conceput să fie construit pe el. Iată ce e nou 🧵 1/7
Livrare astăzi: → Cod complet, greutăți de model și cod de antrenament → acces la API pentru integrarea în producție → LTX Studio pentru generarea pe bază de web Rulează-l local. Ajustează-l. Integrează-l direct în fluxurile tale de lucru. 2/7
Cea mai mare îmbunătățire este fidelitatea vizuală și stabilitatea mișcării. Un nou VAE video și un spațiu latent rafinat oferă detalii fine mai clare și o mișcare mai stabilă. Imagini-video se menține mai bine împreună, texturile mici rezistă compresiei, iar interpolarea din ultimul cadru face ca finalurile să pară intenționate. Am aplicat, de asemenea, o filtrare a datelor mai agresivă și o procesare îmbunătățită a datelor, ceea ce îmbunătățește direct detaliile vizuale fine și reduce artefactele. 3/7
Înțelegerea promptă a reprezentat, de asemenea, un pas real înainte. Un conector de text mai mare îmbunătățește modul în care modelul interpretează mișcarea camerei, compoziția scenei și acțiunile personajelor. Nu mai trebuie să supra-proiectezi prompturile pentru a obține rezultate previzibile. Sub capotă, normalizarea adaptivă și atenția blocată strâng controlul fără a crește complexitatea. 4/7
Keyframe-urile și controlul structurat sunt acum mai profund integrate. LTX-2.3 este antrenat cu obiective multi-sarcină încă din etapa de pre-antrenament, inclusiv imagine-to-video, retake, cadre cheie și altele. Acest lucru face tranzițiile, evoluția controlată a scenei și fluxurile de lucru cu mai multe cadre mai consistente și mai fiabile. 5/7
Calitatea audio s-a îmbunătățit și ea pe toate planurile. Un nou vocoder crește claritatea dialogului și realismul sonor. Alinierea cross-modală între audio și video este mai strânsă. O filtrare mai puternică și o procesare îmbunătățită a datelor reduc ieșirile zgomotoase și îmbunătățesc fidelitatea generală a sunetului. 6/7
129