Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

qinbafrank

Инвестор в криптовалюту, ТМТ, искусственный интеллект, отслеживание самых передовых технологических тенденций, дикие макроэкономические и экономические наблюдения, исследование глобальной ликвидности капитала, инвестиции в циклические тренды. Записывайте личное обучение и мышление, часто ошибайтесь, падайте в яму и нормально поднимайтесь по яме. Бегун🏃

Как сохранить экономическую непрерывность в бурном мире? Мир переходит от порядка, основанного на правилах, к порядку, основанному на силе, и геополитические конфликты в будущем только увеличатся и станут более интенсивными. Прошло всего 2 месяца с начала 26 года, и мы должны это хорошо осознавать. В такой обстановке, как индивидуум, особенно для тех, кто находится в центре конфликта: закрытие банков, разрыв платежных каналов, сбой систем идентификации или даже разрушение банков и уничтожение данных (что произошло в прошлом году с Национальным банком Ирана) может быть критичным. Когда вы обнаруживаете, что не можете подтвердить свою личность, не можете произвести платеж или даже возникают проблемы с банковской системой, это и есть проблема экономической непрерывности. В это время движение цен на активы уже не имеет значения, ключевым становится вопрос, может ли экономика продолжать функционировать. Так как же сохранить экономическую непрерывность? Многие страны и технические команды постоянно исследуют этот вопрос. Ищя информацию по этой теме, я наткнулся на интересный продукт от sign — Verifiable Credentials (доказуемые удостоверения, сокращенно VC): это не очередная игрушка на блокчейне, а реальное решение для обеспечения экономической непрерывности в условиях войны. Давайте разберем, как это работает: 1) issuer (выдающая сторона): государственные органы, университеты, медицинские учреждения, компании и другие авторитетные организации, которые единожды подписывают удостоверение с помощью закрытого ключа (например, удостоверение личности, диплом, медицинские записи, свидетельство о праве собственности, водительские права, доступ к CBDC и т.д.). 2) Holder (держатель): гражданин/пользователь, который хранит удостоверение в своем мобильном кошельке или цифровом кошельке, полностью контролируя его. 3) Verifier (проверяющая сторона): любая организация/сервис, которому необходимо подтвердить информацию (аэропорты, банки, работодатели, больницы и т.д.), проверяет подпись и статус отзыва локально, без необходимости связываться с выдающей стороной или загружать данные на центральный сервер. Это также предотвращает единую точку отказа. Основное преимущество этого дизайна заключается в защите конфиденциальности и выборочном раскрытии. Например, пользователь может подтвердить, что он "старше 18 лет", не раскрывая дату рождения, или подтвердить "наличие действительного диплома", не раскрывая конкретные оценки. Это предотвращает риски конфиденциальности, связанные с копированием данных и распространением журналов в традиционных системах. В то же время VC поддерживает расширение на различные сценарии, включая право собственности на недвижимость, водительские права, подтверждения соответствия и даже управление удостоверениями реальных активов (RWA). Это также своего рода "блокчейн-паспорт". По сути, Verifiable Credentials строят для нас параллельную цепочку, не зависящую от кого-либо: она обеспечивает непрерывность платежей, идентичности и экономической активности, а не разрушается, как традиционные физические системы, при первом же взрыве. С этой точки зрения, Verifiable Credentials нацелены на решение актуальной проблемы: в условиях войны суверенитет "внезапно становится очень реальным", и необходимо обеспечить, чтобы даже если физическая инфраструктура будет уничтожена, экономическая непрерывность оставалась непоколебимой. Вот почему Центр блокчейна Абу-Даби, сильно пострадавший от ситуации в Иране, установил стратегический альянс с sign; Кыргызстан, ближайший к Ближнему Востоку, активно сотрудничает с Digital Som для реализации пилотного проекта цифровой валюты центрального банка; а африканская страна Сьерра-Леоне реализует цепочку идентификации граждан через SignPass, чтобы обеспечить суверенитет граждан. Эти страны осознали, что в условиях геополитического кризиса зависимость от традиционных централизованных систем данных несет значительные риски. Они также размышляют и исследуют, как сохранить способность к экономической непрерывности в бурные времена. Таким образом, выбор людей будет становиться все более прагматичным: это не идеологическая борьба и не вопрос, кто сможет сделать лучше, а вопрос о том, можно ли безопасно подключиться и избежать единой точки отказа. Хотя это жестоко, но мы также должны признать, что хаос — это золотая эпоха для формирования распределенного суверенитета. Кто сможет это сделать, тот получит больше пространства. С этой точки зрения будущее Verifiable Credentials выглядит многообещающим.

Недавно я обнаружил, что область оценки ИИ вошла в стадию высокой зрелости и быстрого итерационного развития. Традиционные бенчмарки (такие как MMLU, HumanEval) достигают насыщения, а новое поколение фреймворков и методов сосредоточено на реальных возможностях (агентные, компьютерные, многомодальные рассуждения), статистической строгости, количественной оценке неопределенности, безопасности/достоверности и борьбе с загрязнением/долгими хвостами. Ранее тестировались большие модели, теперь тестируются ИИ-агенты. Эти платформы помогают разработчикам и компаниям проводить полное тестирование надежности, точности, стоимости, безопасности и производительности ИИ от разработки до развертывания в производстве. Grok составил список самых популярных платформ для оценки ИИ.

Что является ключевыми аспектами развертывания ИИ в компаниях? В отличие от использования ИИ больших моделей или ИИ-агентов потребителями, развертывание ИИ в компаниях требует высоких стандартов для производственной среды, плотной документации и контекстной среды, необходимы высокая точность и как можно более низкий, даже нулевой уровень ошибок. Это не просто заставить ИИ писать стихи, общаться, генерировать изображения или решать математические задачи, а действительно интегрировать ИИ в реальные бизнес-процессы компании или предприятия, чтобы ИИ выполнял сложные, трудоемкие задачи, требующие высокой точности, которые люди выполняют каждый день. Если нельзя гарантировать точность ИИ, то компаниям будет сложно с уверенностью развернуть ИИ. Посмотрите на Arena, представленную SentientAGI, это довольно интересно. Она предоставляет этим ИИ-агентам реальные задачи (или высоко реалистичные) для бизнеса, с строгими критериями оценки (такими как точность, полнота доказательств, уровень иллюзий, правильность ссылок, время выполнения и т.д.), а затем систематически фиксирует модели неудач (например, "выдумывание данных из ничего", "ошибочные ссылки", "прыжки в рассуждениях", "упущение ключевых пунктов"), в конечном итоге постоянно итеративно сравнивая и открыто показывая разработчикам разрыв и позволяя им улучшаться. Короче говоря, Arena не измеряет "насколько умный ИИ", а измеряет, может ли он точно понять намерение и выполнить задачу, по сути, это тест на то, может ли этот ИИ действительно работать в крупных компаниях, особенно в тех самых сложных для автоматизации и легких для ошибок рабочих процессах. С этой точки зрения Arena является платформой для соревнований, где разработчики представляют ИИ-агентов для стандартизированных задач и сравнивают результаты в одинаковых условиях тестирования. Это похоже на "турнир ИИ-агентов", где все ИИ-агенты честно соревнуются по одним и тем же правилам на одной арене. Затем платформа может отслеживать категории сбоев, такие как иллюзии, отсутствие доказательств, неправильные ссылки и разрывы в рассуждениях, что позволяет разработчикам диагностировать повторяющиеся проблемы. Похоже, что Sentient надеется таким образом заставить сообщество с открытым исходным кодом сделать надежность ИИ-агентов, длинные цепочки рассуждений и возможность аудита такими, чтобы компании могли смело внедрять их в реальные производственные условия, а не оставаться только на этапе демонстрации и набора очков в таблицах лидеров. Это действительно может помочь продвинуть ИИ к новым SOTA (state-of-the-art, передовым уровням) в задачах рассуждений на уровне реального мира. С этой точки зрения также можно понять, почему такие крупные финансовые инвестиционные учреждения, как Franklin Templeton, Founders Fund, Pantera, OpenRouter и другие, готовы участвовать в сотрудничестве, потому что они сами также очень обеспокоены этим вопросом, и учреждениям и компаниям действительно важно, готовы ли они внедрить ИИ в свои реальные бизнес-решения. Я все еще с нетерпением жду дальнейших успехов платформы Arena, это также должно быть очень важным элементом в дорожной карте "открытого AGI", которую хочет продвигать Sentient.

Топ

Рейтинг

Избранное