Většina inferenčních platforem nebyla stavěna pro vlastní modely. Specializovaná inference kontejnerů je. Orchestrace na úrovni práce, řízení provozu řízené politikami a praktická optimalizace jádra. Zákazníci zaznamenali 1,4x až 2,6x rychlejší závěry o generování videa v produkci.