LTX-2.3 on merkittävä päivitys. Se on tuotantovalmis multimodaalinen moottori – suunniteltu rakennettavaksi. Tässä mitä uutta 🧵 on 1/7
Lähetys tänään: → Täysi koodi, mallipainot ja koulutuskoodi → API-pääsy tuotantointegraatioon → LTX Studio verkkopohjaiseen generointiin Aja se paikallisesti. Hienosäädä sitä. Integroi se suoraan työnkulkuihisi. 2/7
Suurin parannus on visuaalinen tarkkuus ja liikkeen vakaus. Uusi video-VAE ja hiottu latenttitila tarjoavat terävämmät yksityiskohdat ja vakaamman liikkeen. Kuvasta videoon -yhdistelmä pysyy paremmin kasassa, pienet tekstuurit kestävät kompressiota, ja viimeisen ruudun interpolointi saa loput tuntumaan tarkoituksellisilta. Sovelsimme myös aggressiivisempaa datan suodatusta ja parannettua datan käsittelyä, mikä parantaa suoraan hienoja visuaalisia yksityiskohtia ja vähentää artefakteja. 3/7
Nopea ymmärrys otti myös todellisen askeleen eteenpäin. Suurempi tekstiliitin parantaa mallin tulkintaa kameran liikkeitä, kohtauksen sommittelua ja hahmojen toimintoja. Sinun ei enää tarvitse yliohjata kehotuksia saadaksesi ennustettavia tuloksia. Konepellin alla adaptiivinen normalisointi ja lukittu tarkkaavaisuus tiukentavat kontrollia lisäämättä monimutkaisuutta. 4/7
Avainkehykset ja rakenteellinen ohjaus ovat nyt syvemmin integroituneita. LTX-2.3 on koulutettu monitehtävätavoitteisiin jo esikoulutusvaiheessa, mukaan lukien kuvasta videoon -ote, uudelleenotto, avainkehykset ja paljon muuta. Tämä tekee siirtymistä, hallitun kohtauksen kehityksestä ja monikuvatyönkuluista johdonmukaisempia ja luotettavampia. 5/7
Äänenlaatu parani myös kautta linjan. Uusi vokooderi lisää dialogin selkeyttä ja äänen realismia. Äänen ja kuvan välinen ristiinmodaalinen kohdistus on tiukempi. Vahvempi suodatus ja parannettu datankäsittely vähentävät kohinaisia tuloksia ja parantavat äänenlaadun kokonaisuutta. 6/7
127