17 000 tokenia sekunnissa!! Lue se uudestaan! LLM on kiinteästi kytketty suoraan piihin. Ei HBM:ää, ei nestejäähdytystä, vain raakaa erikoislaitteistoa. 10 kertaa nopeammin ja 20 kertaa halvempi kuin B200. "odottamalla LLM:n ajattelevan" -aikakausi on kuollut. Koodi syntyy ihmisen ajattelun nopeudella. Siirtyminen raakavoimaisista GPU-klustereista oikeisiin tekoälylaitteisiin.