Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

qinbafrank
Інвестор у криптовалюту, TMT, AI, відстеження найсучасніших технологічних тенденцій, дикі макрополітичні та економічні спостереження, дослідження глобальної ліквідності капіталу, інвестиції в циклічні тренди. Записуйте особисте навчання і мислення, частіше помиляйтеся, падайте в яму і нормально піднімайтеся по ямі. Бігун🏃
Як зберегти економічну безперервність у неспокійному світі? Світ переходить від порядку, керованого правилами, до порядку, що керується силою, і геополітичні конфлікти лише посилюватимуться і загострюватимуться в майбутньому. Минуло лише 2 місяці з початку 26 років, і ми маємо глибоко це розуміти. У такому середовищі, як окремі особи, особливо для країн і людей, які перебувають у вирі глибоких конфліктів: закриття банків, зламані платіжні канали, паралізовані системи ідентичності, а навіть вибухи банків і знищення даних (це сталося з Національним банком Ірану минулого року) є дуже смертельними. Коли ви не можете довести свою особу, не можете оплатити або навіть у банківської системи проблеми — це питання економічної безперервності. Наразі тенденція цін на активи не має значення, і питання, чи зможе економіка продовжувати існування, стало ключовим питанням.
Отже, як зберегти економічну безперервність? Багато країн і технічних команд постійно досліджують цей аспект. Шукаючи інформацію з цього приводу, цікаво бачити, що Verifyable Credentials (VC) були запущені за знаком: це не просто ще одна вишукана іграшка блокчейну, а справжнє рішення для економічної безперервності воєнного часу.
Ось короткий розбір того, як у неї грати:
1) Емітент: Уряди, університети, медичні установи, підприємства та інші авторитетні установи підписують посвідчення приватними ключами (такими як державний статус резидента, сертифікати ступеня, медичні записи, сертифікати нерухомості, водійські права, права доступу до CBDC тощо).
2) Власник: Громадянин/користувач, який зберігає облікові дані у своєму мобільному або цифровому гаманці та має повний контроль над ними.
3) Верифікатор: Будь-яка установа/служба (аеропорт, банк, роботодавець, лікарня тощо), яка потребує підтвердження інформації, безпосередньо підтверджує підпис + відкликає статус локально, без зв'язку з емітентом або завантаження даних на центральний сервер. Це також дозволяє уникнути однієї точки відмови
Основні переваги цього дизайну — захист приватності та вибіркове розкриття інформації. Наприклад, користувачі можуть довести, що їм «понад 18 років», не розкриваючи дату народження, або підтвердити, що вони «мають дійсний диплом», не розкриваючи конкретні оцінки. Це уникає ризиків конфіденційності, пов'язаних із реплікацією даних та поширенням журналів у традиційних системах. Водночас перевірені венчурні повноваження можуть бути розширені на різні сценарії, включно з володінням нерухомістю, водійськими посвідченнями, сертифікатами відповідності та навіть управлінням сертифікатами для реальних активів (RWA). Це також якась форма «паспорта на ланцюгу»
Це еквівалентно тому, що Verifiable Credentials будує нам парачейн-трек, який ні від кого не залежить від інших: він може забезпечити безперервні платежі, ідентифікації та економічну діяльність, а не бути знищеним, як традиційні фізичні системи.
У цьому сенсі Verifiable Credentials прагне дуже прямо влучити в суть: у війні суверенітет «раптово стає дуже реальним» і повинен забезпечити, щоб економічна безперервність залишалася непорушною навіть у разі знищення фізичної інфраструктури.
Саме тому Abu Dhabi Blockchain Center, який глибоко постраждав від ситуації в Ірані, створив стратегічний альянс із підписом; Киргизстан, найближчий до Близького Сходу, активно співпрацює з Digital Som у пілотному проєкті цифрової валюти національного центрального банку; Африканська країна Сьєрра-Леоне використовує SignPass для отримання статусу резидента в мережі з метою захисту суверенітету громадян. Ці країни виявили, що залежність від традиційних централізованих систем даних становить значні ризики в часи геополітичної кризи. Вони також розмірковують і досліджують можливість підтримувати економічну безперервність у неспокійні часи.
Отже, вибір кожного ставатиме дедалі прагматичнішим: це не ідеологічна боротьба і не хто може зробити краще, але ми повинні надати пріоритет тому, чи зможемо безпечно дістатися і уникати окремих точок невдачі.
Хоча це жорстоко, ми також маємо визнати, що хаос — це золота епоха створення розподіленого суверенітету. Хто зробить це добре, отримає більше простору. З цієї точки зору майбутнє Verifiable Credentials є обнадійливим.
342
Нещодавно було виявлено, що сфера оцінки ШІ перейшла у надзвичайно зрілий і швидко ітеративний етап. Традиційні бенчмарки (наприклад, MMLU, HumanEval) зазвичай насичені, а фреймворки та методології наступного покоління зосереджені на реальних можливостях (агентні, комп'ютерні, мультимодальні висновки), статистичній строгості, кількісній оцінці невизначеності, безпеці/надійності та викликах проти забруднення/довгохвостого використання. Раніше ми тестували великі моделі, а тепер тестуємо AI-агентів. Ці платформи допомагають розробникам і підприємствам тестувати надійність, точність, вартість, безпеку та продуктивність ШІ від ітерації розробки до впровадження у виробництві. Нехай grok розбереться зі списком найпопулярніших платформ для оцінки ШІ


qinbafrank3 бер., 11:08
Які ключові аспекти впровадження корпоративного ШІ? На відміну від споживачів, які використовують великі моделі або агенти ШІ, підприємства впроваджують ШІ з надзвичайно високими вимогами до виробничих середовищ, щільними документами та контекстними середовищами, а також вимагають високої точності, мінімального або навіть нульового рівня помилок. Оскільки це не для того, щоб ШІ писав вірші, спілкувався, створював зображення чи розв'язував математичні задачі, а щоб справді впроваджувати ШІ у реальний бізнес-процес роботи та виробництва підприємства чи компанії, це дозволяє ШІ виконувати складну, нудну і надзвичайно точну роботу, яку люди виконують щодня.
Досить цікаво бачити, як Arena була запущена компанією SentientAGI. Він надає цим агентам ШІ реальну складність (або сильно змодельовані) корпоративні завдання через суворі критерії оцінювання (такі як точність, повнота доказів, рівень галюцинацій, точність цитувань, час виконання тощо), а потім систематично фіксує режими відмов (наприклад, «вигадування даних з повітря», «посилання на неправильні джерела», «стрибки в міркуванні», «відсутні ключові положення»), а потім ітерує та відкрито порівнює, щоб дозволити розробникам бачити прогалини та покращуватися.
Коротко кажучи, Arena — це не тест «чи розумний ШІ», а те, чи може він точно розуміти наміри та виконувати завдання, фактично перевіряючи, чи може цей ШІ справді працювати у великих компаніях, особливо в тих робочих зв'язках і процесах, які найскладніше автоматизувати і які найбільш схильні до аварій.
З цієї точки зору Arena — це платформа для змагань, де розробники подають агентів ШІ на стандартизовані завдання та порівнюють результати за умов послідовного тестування. Це схоже на «змагання агентів ШІ», де агенти ШІ змагаються справедливо за однаковими правилами в одній арені. Платформа відстежує категорії помилок, такі як галюцинації, відсутні докази, неправильні цитування та прогалини у висновках, що дозволяє розробникам діагностувати повторювані проблеми.
Схоже, що Sentient сподівається змусити спільноту відкритого коду досягти надійності, довголанцюгового мислення та аудитуваності агентів ШІ в реальному середовищі, де підприємства наважуються перейти у виробництво, а не просто залишатися на етапах демонстрації та таблиці лідерів. Саме це справді допоможе підняти ШІ на новий рівень (найсучасніший) для реаліальних завдань інференції на рівні підприємств.
З цієї точки зору я також розумію, чому ці великі інституції у сфері фінансових інвестицій, такі як Franklin Templeton, Founders Fund, Pantera, OpenRouter тощо, готові брати участь у співпраці, адже вони самі дуже переймаються цим, а інституції та підприємства справді переймаються тим, чи наважаться вони впроваджувати ШІ у мій реальний процес прийняття бізнес-рішень.
Я все ще з нетерпінням чекаю подальшого прогресу над платформою Arena, яка має стати дуже важливою частиною дорожньої карти «Open AGI», яку Sentient хоче просувати.
85
Microsoft сьогодні досить складна

qinbafrank5 бер., 00:44
Microsoft також запустила власного AI-агента Copilot Tasks, що слід розглядати як важливий крок для Microsoft у вході в «агентний ШІ» та нарешті в темпі OpenAI, Anthropic, Google та інших компаній. Однак на цьому етапі він відкритий лише для невеликої кількості користувачів, і для тестування потрібно приєднатися до списку очікування.
Дивлячись на демонстрацію твіту Надрада, Copilot Tasks має бути глибоко інтегрована з Microsoft 365, здатна працювати з Outlook, Teams, Word, Excel тощо, а також виконувати складні багатокрокові завдання (здатні розбивати кроки→ планування→ виконання → звітність), з акцентом на «від відповіді до дії».
Схоже, це версія Microsoft про «автономних цифрових працівників ШІ» для звичайних користувачів і офісних ситуацій, яка оновлює Copilot від «чат-асистента» до «агента, який може допомогти нам працювати».
Минулого тижня динамічне співвідношення цін і прибутку Microsoft повернулося до найнижчого рівня за останнє десятиліття і увійшло в діапазон економічної ефективності. Запуск Copilot Tasks робить це ще більш економічно вигідним. Цього року великі технологічні компанії прискорюють впровадження агентів ШІ, і офісні та продуктивні сценарії є центром зусиль кожної компанії. У сфері продуктивності офісу Microsoft має найбільшу перевагу.

132
Найкращі
Рейтинг
Вибране