Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
LTX-2.3 è un aggiornamento importante.
È un motore multimodale pronto per la produzione - progettato per essere costruito.
Ecco cosa c'è di nuovo 🧵
1/7
Spedizione oggi:
→ Codice completo, pesi del modello e codice di addestramento
→ Accesso API per integrazione in produzione
→ LTX Studio per generazione basata sul web
Eseguilo localmente. Affina. Integralo direttamente nei tuoi flussi di lavoro.
2/7
Il più grande aggiornamento è la fedeltà visiva e la stabilità del movimento.
Un nuovo video VAE e uno spazio latente raffinato offrono dettagli fini più nitidi e un movimento più stabile.
L'immagine in video si mantiene meglio, le piccole texture sopravvivono alla compressione e l'interpolazione dell'ultimo fotogramma rende le conclusioni più intenzionali.
Abbiamo anche applicato un filtraggio dei dati più aggressivo e migliorato l'elaborazione dei dati, il che migliora direttamente i dettagli visivi fini e riduce gli artefatti.
3/7
La comprensione dei prompt ha fatto un vero passo avanti.
Un connettore di testo più ampio migliora il modo in cui il modello interpreta il movimento della camera, la composizione della scena e le azioni dei personaggi.
Non è più necessario sovra-ingegnerizzare i prompt per ottenere risultati prevedibili.
Sotto il cofano, la normalizzazione adattiva e l'attenzione gated stringono il controllo senza aumentare la complessità.
4/7
I fotogrammi chiave e il controllo strutturato sono ora più profondamente integrati.
LTX-2.3 è addestrato con obiettivi multi-task dalla fase di pre-addestramento, inclusi immagine-a-video, ripresa, fotogrammi chiave e altro ancora.
Questo rende le transizioni, l'evoluzione controllata delle scene e i flussi di lavoro multi-scena più coerenti e affidabili.
5/7
La qualità audio è migliorata in generale.
Un nuovo vocoder aumenta la chiarezza del dialogo e il realismo del suono. L'allineamento cross-modale tra audio e video è più preciso.
Filtraggio più forte e miglior elaborazione dei dati riducono le uscite rumorose e migliorano la fedeltà audio complessiva.
6/7
65
Principali
Ranking
Preferiti
