Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

qinbafrank
Инвестор в криптовалюту, ТМТ, искусственный интеллект, отслеживание самых передовых технологических тенденций, дикие макроэкономические и экономические наблюдения, исследование глобальной ликвидности капитала, инвестиции в циклические тренды. Записывайте личное обучение и мышление, часто ошибайтесь, падайте в яму и нормально поднимайтесь по яме. Бегун🏃
Как сохранить экономическую непрерывность в бурном мире? Мир переходит от порядка, основанного на правилах, к порядку, основанному на силе, и геополитические конфликты в будущем только увеличатся и станут более интенсивными. Прошло всего 2 месяца с начала 26 года, и мы должны это хорошо осознавать. В такой обстановке, как индивидуум, особенно для тех, кто находится в центре конфликта: закрытие банков, разрыв платежных каналов, сбой систем идентификации или даже разрушение банков и уничтожение данных (что произошло в прошлом году с Национальным банком Ирана) может быть критичным. Когда вы обнаруживаете, что не можете подтвердить свою личность, не можете произвести платеж или даже возникают проблемы с банковской системой, это и есть проблема экономической непрерывности. В это время движение цен на активы уже не имеет значения, ключевым становится вопрос, может ли экономика продолжать функционировать.
Так как же сохранить экономическую непрерывность? Многие страны и технические команды постоянно исследуют этот вопрос. Ищя информацию по этой теме, я наткнулся на интересный продукт от sign — Verifiable Credentials (доказуемые удостоверения, сокращенно VC): это не очередная игрушка на блокчейне, а реальное решение для обеспечения экономической непрерывности в условиях войны.
Давайте разберем, как это работает:
1) issuer (выдающая сторона): государственные органы, университеты, медицинские учреждения, компании и другие авторитетные организации, которые единожды подписывают удостоверение с помощью закрытого ключа (например, удостоверение личности, диплом, медицинские записи, свидетельство о праве собственности, водительские права, доступ к CBDC и т.д.).
2) Holder (держатель): гражданин/пользователь, который хранит удостоверение в своем мобильном кошельке или цифровом кошельке, полностью контролируя его.
3) Verifier (проверяющая сторона): любая организация/сервис, которому необходимо подтвердить информацию (аэропорты, банки, работодатели, больницы и т.д.), проверяет подпись и статус отзыва локально, без необходимости связываться с выдающей стороной или загружать данные на центральный сервер. Это также предотвращает единую точку отказа.
Основное преимущество этого дизайна заключается в защите конфиденциальности и выборочном раскрытии. Например, пользователь может подтвердить, что он "старше 18 лет", не раскрывая дату рождения, или подтвердить "наличие действительного диплома", не раскрывая конкретные оценки. Это предотвращает риски конфиденциальности, связанные с копированием данных и распространением журналов в традиционных системах. В то же время VC поддерживает расширение на различные сценарии, включая право собственности на недвижимость, водительские права, подтверждения соответствия и даже управление удостоверениями реальных активов (RWA). Это также своего рода "блокчейн-паспорт".
По сути, Verifiable Credentials строят для нас параллельную цепочку, не зависящую от кого-либо: она обеспечивает непрерывность платежей, идентичности и экономической активности, а не разрушается, как традиционные физические системы, при первом же взрыве.
С этой точки зрения, Verifiable Credentials нацелены на решение актуальной проблемы: в условиях войны суверенитет "внезапно становится очень реальным", и необходимо обеспечить, чтобы даже если физическая инфраструктура будет уничтожена, экономическая непрерывность оставалась непоколебимой.
Вот почему Центр блокчейна Абу-Даби, сильно пострадавший от ситуации в Иране, установил стратегический альянс с sign; Кыргызстан, ближайший к Ближнему Востоку, активно сотрудничает с Digital Som для реализации пилотного проекта цифровой валюты центрального банка; а африканская страна Сьерра-Леоне реализует цепочку идентификации граждан через SignPass, чтобы обеспечить суверенитет граждан. Эти страны осознали, что в условиях геополитического кризиса зависимость от традиционных централизованных систем данных несет значительные риски. Они также размышляют и исследуют, как сохранить способность к экономической непрерывности в бурные времена.
Таким образом, выбор людей будет становиться все более прагматичным: это не идеологическая борьба и не вопрос, кто сможет сделать лучше, а вопрос о том, можно ли безопасно подключиться и избежать единой точки отказа.
Хотя это жестоко, но мы также должны признать, что хаос — это золотая эпоха для формирования распределенного суверенитета. Кто сможет это сделать, тот получит больше пространства. С этой точки зрения будущее Verifiable Credentials выглядит многообещающим.
359
Недавно я обнаружил, что область оценки ИИ вошла в стадию высокой зрелости и быстрого итерационного развития. Традиционные бенчмарки (такие как MMLU, HumanEval) достигают насыщения, а новое поколение фреймворков и методов сосредоточено на реальных возможностях (агентные, компьютерные, многомодальные рассуждения), статистической строгости, количественной оценке неопределенности, безопасности/достоверности и борьбе с загрязнением/долгими хвостами. Ранее тестировались большие модели, теперь тестируются ИИ-агенты. Эти платформы помогают разработчикам и компаниям проводить полное тестирование надежности, точности, стоимости, безопасности и производительности ИИ от разработки до развертывания в производстве. Grok составил список самых популярных платформ для оценки ИИ.


qinbafrank3 мар., 11:08
Что является ключевыми аспектами развертывания ИИ в компаниях? В отличие от использования ИИ больших моделей или ИИ-агентов потребителями, развертывание ИИ в компаниях требует высоких стандартов для производственной среды, плотной документации и контекстной среды, необходимы высокая точность и как можно более низкий, даже нулевой уровень ошибок. Это не просто заставить ИИ писать стихи, общаться, генерировать изображения или решать математические задачи, а действительно интегрировать ИИ в реальные бизнес-процессы компании или предприятия, чтобы ИИ выполнял сложные, трудоемкие задачи, требующие высокой точности, которые люди выполняют каждый день. Если нельзя гарантировать точность ИИ, то компаниям будет сложно с уверенностью развернуть ИИ.
Посмотрите на Arena, представленную SentientAGI, это довольно интересно. Она предоставляет этим ИИ-агентам реальные задачи (или высоко реалистичные) для бизнеса, с строгими критериями оценки (такими как точность, полнота доказательств, уровень иллюзий, правильность ссылок, время выполнения и т.д.), а затем систематически фиксирует модели неудач (например, "выдумывание данных из ничего", "ошибочные ссылки", "прыжки в рассуждениях", "упущение ключевых пунктов"), в конечном итоге постоянно итеративно сравнивая и открыто показывая разработчикам разрыв и позволяя им улучшаться.
Короче говоря, Arena не измеряет "насколько умный ИИ", а измеряет, может ли он точно понять намерение и выполнить задачу, по сути, это тест на то, может ли этот ИИ действительно работать в крупных компаниях, особенно в тех самых сложных для автоматизации и легких для ошибок рабочих процессах.
С этой точки зрения Arena является платформой для соревнований, где разработчики представляют ИИ-агентов для стандартизированных задач и сравнивают результаты в одинаковых условиях тестирования. Это похоже на "турнир ИИ-агентов", где все ИИ-агенты честно соревнуются по одним и тем же правилам на одной арене. Затем платформа может отслеживать категории сбоев, такие как иллюзии, отсутствие доказательств, неправильные ссылки и разрывы в рассуждениях, что позволяет разработчикам диагностировать повторяющиеся проблемы.
Похоже, что Sentient надеется таким образом заставить сообщество с открытым исходным кодом сделать надежность ИИ-агентов, длинные цепочки рассуждений и возможность аудита такими, чтобы компании могли смело внедрять их в реальные производственные условия, а не оставаться только на этапе демонстрации и набора очков в таблицах лидеров. Это действительно может помочь продвинуть ИИ к новым SOTA (state-of-the-art, передовым уровням) в задачах рассуждений на уровне реального мира.
С этой точки зрения также можно понять, почему такие крупные финансовые инвестиционные учреждения, как Franklin Templeton, Founders Fund, Pantera, OpenRouter и другие, готовы участвовать в сотрудничестве, потому что они сами также очень обеспокоены этим вопросом, и учреждениям и компаниям действительно важно, готовы ли они внедрить ИИ в свои реальные бизнес-решения.
Я все еще с нетерпением жду дальнейших успехов платформы Arena, это также должно быть очень важным элементом в дорожной карте "открытого AGI", которую хочет продвигать Sentient.
93
Сегодня Microsoft довольно крепка

qinbafrank5 мар., 00:44
Microsoft также представила своего AI-агента Copilot Tasks, что можно считать важным шагом Microsoft в направлении "Agentic AI", наконец-то успев за такими компаниями, как OpenAI, Anthropic и Google. Однако на данный момент он доступен только для ограниченного числа пользователей, необходимо присоединиться к списку ожидания, чтобы протестировать.
Судя по демонстрации твита Наделлы, Copilot Tasks должен быть глубоко интегрирован с Microsoft 365, способен управлять Outlook, Teams, Word, Excel и обрабатывать сложные многошаговые задачи (может разбивать шаги → планировать → выполнять → отчитываться), подчеркивая "от ответов к действиям".
Это выглядит как версия Microsoft для обычных пользователей и офисных сценариев "самостоятельного AI-цифрового работника", который обновляет Copilot с "чат-ассистента" до "агента, который может помочь нам работать".
На прошлой неделе, обсуждая динамику Microsoft, коэффициент P/E уже вернулся к минимальному уровню за последние десять лет, попав в диапазон разумной цены. Запуск Copilot Tasks делает эту разумную цену еще более привлекательной. В этом году крупные технологические компании ускоряют внедрение AI-агентов, и офисные, производственные сценарии являются ключевыми направлениями для всех. В офисных и производственных сценариях Microsoft имеет наибольшее преимущество.

165
Топ
Рейтинг
Избранное