Я сжег 84 миллиона токенов 28 февраля. Исследую компании, составляю меморандумы, управляю агентами. Это работа Kimi K2.5, безсерверной модели через API. По тарифам Claude или OpenAI — примерно $9 за миллион смешанных токенов — эквивалентное использование обошлось бы в $756 за однодневную работу. В мои пиковые дни я достигал 80 миллионов токенов. В среднем я использую 20 миллионов. Облачный вывод по ценам на передовые модели быстро накапливается.
На этой неделе Alibaba выпустила Qwen3.5-9B, открытую модель, которая соответствует Claude Opus 4.1 от декабря 2025 года. Она работает локально на 12 ГБ ОЗУ. Три месяца назад эта возможность требовала дата-центра. Теперь для этого нужен только электрический разъем.
Ноутбук за 5,000 долларов — MacBook Pro с достаточным объемом памяти для локального запуска Qwen — окупается после 556 миллионов токенов. При моем уровне использования это занимает около месяца. При 20 миллионах токенов в день это четыре недели. После окупаемости предельные затраты снижаются до расходов на электроэнергию. Это не компромисс в интеллекте. Рассуждение, кодирование, агентные рабочие процессы, обработка документов, выполнение инструкций: модель 9B соответствует декабрьскому рубежу по всем направлениям.
@twlvone Больше вычислительных мощностей не помогает за пределами определенного уровня точности вызова инструментов
43