17 000 токенів за секунду!! Прочитайте ще раз! LLM жорстко підключений безпосередньо до кремнію. Без HBM, без рідинного охолодження, лише спеціалізоване обладнання. У 10 разів швидше і у 20 разів дешевше, ніж у B200. епоха «очікування, поки LLM подумає» померла. Код генерується зі швидкістю людської думки. Перехід від кластерів GPU для перебору до справжніх AI-пристроїв.