Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

qinbafrank
Inwestor w kryptowaluty, TMT, AI, śledzenie najnowocześniejszych trendów technologicznych, szalone obserwacje makropolityczne i gospodarcze, badanie globalnej płynności kapitału i inwestowanie w trendach cyklicznych. Nagrywaj osobistą naukę i myślenie, często popełniaj błędy, wpadaj do dołów i wspinaj się po dołach. Biegacz🏃
Jak utrzymać ciągłość gospodarczą w niestabilnym świecie? Świat przechodzi z porządku opartego na zasadach do porządku opartego na sile, a konflikty geopolityczne w przyszłości będą tylko narastać i stawać się coraz bardziej intensywne. Mamy dopiero dwa miesiące nowego roku, a już powinniśmy to głęboko odczuwać. W takim środowisku, jako jednostki, szczególnie dla tych, którzy znajdują się w samym centrum konfliktów: zamknięcie banków, przerwanie kanałów płatności, paraliż systemów tożsamości, a nawet zniszczenie danych bankowych (co miało miejsce w zeszłym roku w Iranie) jest bardzo poważnym problemem. Kiedy odkrywasz, że nie możesz udowodnić swojej tożsamości, nie możesz dokonać płatności, a nawet system bankowy ma problemy, to jest to problem ciągłości gospodarczej. W tym momencie ruchy cen aktywów stają się nieistotne, kluczowe staje się to, czy gospodarka może funkcjonować bez przerwy.
Jak więc utrzymać ciągłość gospodarczą? Wiele krajów i zespołów technologicznych nieustannie bada tę kwestię. Podczas poszukiwań informacji na ten temat natknąłem się na Verifiable Credentials (weryfikowalne poświadczenia, w skrócie VC) od sign, które wydają się bardzo interesujące: to nie kolejna błyszcząca zabawka blockchainowa, ale konkretne rozwiązanie do utrzymania ciągłości gospodarczej w czasie wojny.
Prosto wyjaśniając, jak to działa:
1) issuer (wydawca): rząd, uniwersytety, instytucje medyczne, przedsiębiorstwa i inne autorytatywne instytucje, które jednorazowo podpisują poświadczenia kluczem prywatnym (np. poświadczenia tożsamości wydawane przez państwo, dyplomy, dokumenty medyczne, dowody własności, prawo jazdy, dostęp do CBDC itp.).
2) Holder (posiadacz): obywatel/użytkownik, który przechowuje poświadczenia w swoim portfelu mobilnym lub cyfrowym, mając pełną kontrolę.
3) Verifier (weryfikator): każda instytucja/usługa, która potrzebuje potwierdzenia informacji (lotniska, banki, pracodawcy, szpitale itp.), która lokalnie weryfikuje podpis + status unieważnienia, bez potrzeby kontaktowania się z wydawcą lub przesyłania danych do centralnego serwera. To również unika awarii punktu.
Główną zaletą tego projektu jest ochrona prywatności i selektywne ujawnianie. Na przykład użytkownik może udowodnić, że "ma więcej niż 18 lat" bez ujawniania daty urodzenia, lub potwierdzić "posiadanie ważnego dyplomu" bez ujawniania konkretnych ocen. To unika ryzyka prywatności związanego z kopiowaniem danych i rozprzestrzenianiem logów w tradycyjnych systemach. Ponadto VC wspiera rozszerzenie na różne scenariusze, w tym własność nieruchomości, prawo jazdy, certyfikaty zgodności, a nawet zarządzanie poświadczeniami rzeczywistych aktywów (RWA). To również pewna forma "paszportu on-chain".
Verifiable Credentials budują dla nas równoległą ścieżkę, która nie zależy od nikogo: zapewnia ciągłość płatności, tożsamości i działalności gospodarczej, a nie jak tradycyjne systemy fizyczne, które po jednym wybuchu kończą się katastrofą.
W tym sensie Verifiable Credentials celują w bardzo istotny problem: w czasie wojny suwerenność "nagle staje się bardzo realna", co wymaga zapewnienia, że nawet jeśli fizyczna infrastruktura zostanie zniszczona, ciągłość gospodarcza pozostanie nienaruszona.
Dlatego Abu Dhabi Blockchain Center, które jest głęboko dotknięte sytuacją w Iranie, nawiązało strategiczny sojusz z sign; Kirgistan, najbliżej Bliskiego Wschodu, aktywnie współpracuje z Digital Som w celu przeprowadzenia pilotażowego projektu cyfrowej waluty banku centralnego; a Sierra Leone w Afryce realizuje on-chain tożsamość mieszkańców poprzez SignPass, aby zapewnić suwerenność obywateli. Te kraje dostrzegły, że poleganie na tradycyjnych scentralizowanych systemach danych w czasach kryzysu geopolitycznego wiąże się z poważnym ryzykiem. Wszyscy zastanawiają się i badają, jak utrzymać zdolność do ciągłości gospodarczej w czasach niepokoju.
Dlatego wybory wszystkich będą coraz bardziej pragmatyczne: to nie jest walka ideologiczna, ani nie chodzi o to, kto może to zrobić lepiej, ale o to, aby priorytetowo traktować bezpieczeństwo dostępu i unikać awarii punktu.
Choć to brutalne, musimy przyznać, że chaos to złoty wiek dla rozwoju rozproszonej suwerenności. Kto potrafi to dobrze zrobić, ten zyska większą przestrzeń. Z tego punktu widzenia przyszłość Verifiable Credentials wygląda obiecująco.
366
Ostatnio odkryłem, że obszar oceny AI wszedł w fazę wysokiej dojrzałości i szybkiej iteracji. Tradycyjne testy porównawcze (takie jak MMLU, HumanEval) osiągnęły nasycenie, a nowa generacja ram i metod koncentruje się na umiejętnościach w rzeczywistym świecie (agentowe, użycie komputera, rozumowanie multimodalne), rygorze statystycznym, kwantyfikacji niepewności, bezpieczeństwie/wiarygodności oraz wyzwaniach związanych z zanieczyszczeniem/długim ogonem. Wcześniej testowano duże modele, teraz testuje się AI Agent. Te platformy pomagają deweloperom i firmom w pełnym teście niezawodności, dokładności, kosztów, bezpieczeństwa i wydajności AI od iteracji rozwoju po wdrożenie produkcyjne. Grok przygotował listę najpopularniejszych platform oceny AI.


qinbafrank3 mar, 11:08
Czym są kluczowe elementy wdrażania AI w przedsiębiorstwie? W przeciwieństwie do użytkowania dużych modeli AI lub agentów AI przez konsumentów, wdrażanie AI w przedsiębiorstwie wymaga bardzo wysokich standardów w środowisku produkcyjnym, gęstej dokumentacji i kontekstu, co wymaga wysokiej dokładności i możliwie niskiego, a nawet zerowego wskaźnika błędów. Ponieważ nie chodzi o to, aby AI pisało wiersze, prowadziło rozmowy, generowało obrazy czy rozwiązywało zadania matematyczne, ale o to, aby rzeczywiście włączyć AI w rzeczywiste procesy operacyjne i produkcyjne przedsiębiorstwa lub firmy, aby AI mogło wykonać skomplikowane, żmudne prace, które wymagają bardzo wysokiej dokładności, które codziennie wykonują ludzie. Jeśli nie można określić dokładności AI, to przedsiębiorstwo również nie będzie mogło z pełnym zaufaniem wdrożyć AI.
Zobaczcie, co zaprezentowało SentientAGI w tym Arena, to całkiem interesujące. Daje ono tym agentom AI prawdziwe trudności (lub wysoko realistyczne) zadania przedsiębiorstw, poprzez ścisłe kryteria oceny (takie jak dokładność, kompletność dowodów, wskaźnik halucynacji, poprawność cytatów, czas realizacji i inne wskaźniki), a następnie systematycznie rejestruje wzorce niepowodzeń (takie jak „wymyślanie danych z niczego”, „błędne cytowanie źródeł”, „skoki w rozumowaniu”, „pomijanie kluczowych klauzul”), a na końcu nieustannie iteruje, porównując wyniki, aby deweloperzy mogli zobaczyć różnice i poprawić swoje rozwiązania.
Krótko mówiąc, Arena nie mierzy „inteligencji AI”, ale to, czy potrafi dokładnie zrozumieć intencje i wykonać zadania, w rzeczywistości mierzy, czy ten AI może naprawdę pracować w dużych firmach, zwłaszcza w tych najtrudniejszych do zautomatyzowania, najbardziej ryzykownych etapach i procesach.
Z tej perspektywy Arena jest platformą konkursową, na której deweloperzy zgłaszają agentów AI do znormalizowanych zadań i porównują wyniki w jednolitych warunkach testowych. To jak „turniej agentów AI”, gdzie różne agenty AI rywalizują na tej samej arenie według tych samych zasad. Następnie platforma może śledzić kategorie błędów, takie jak halucynacje, brak dowodów, błędne cytaty i luki w rozumowaniu, co pozwala deweloperom diagnozować powtarzające się problemy.
Wygląda na to, że Sentient chce w ten sposób zmusić społeczność open source do zapewnienia niezawodności agentów AI, długiego rozumowania i audytowalności, aby mogły być wdrażane w rzeczywistych środowiskach produkcyjnych, a nie tylko pozostawać na etapie demo i leaderboardów. To naprawdę może pomóc w osiągnięciu nowego SOTA (state-of-the-art, najnowocześniejszy poziom) w zadaniach rozumowania na poziomie przedsiębiorstw w rzeczywistym świecie.
Z tej perspektywy można również zrozumieć, dlaczego takie instytucje inwestycyjne jak Franklin Templeton, Founders Fund, Pantera, OpenRouter i inne są chętne do współpracy, ponieważ same również bardzo się tym interesują, a instytucje i firmy naprawdę martwią się tym, czy mogą włączyć AI do swoich rzeczywistych procesów decyzyjnych.
Czekam z niecierpliwością na dalszy rozwój platformy Arena, co powinno być również kluczowym elementem „otwartej AGI” w planie działania Sentient.
103
Microsoft dzisiaj jest dość twardy

qinbafrank5 mar, 00:44
Microsoft również wprowadził swojego agenta AI, Copilot Tasks, co można uznać za ważny krok w kierunku „Agentic AI”, w końcu może nadążyć za firmami takimi jak OpenAI, Anthropic, Google i innymi. Na obecnym etapie jest dostępny tylko dla ograniczonej liczby użytkowników, trzeba dołączyć do listy oczekujących, aby go przetestować.
Z tego, co widać w tweetach Nadelli, Copilot Tasks powinien być głęboko zintegrowany z Microsoft 365, potrafi obsługiwać Outlook, Teams, Word, Excel i inne, przetwarzając złożone, wieloetapowe zadania (może rozkładać kroki → planować → wykonywać → raportować), podkreślając „od odpowiedzi do działania”.
Wygląda na to, że to wersja Microsoftu skierowana do zwykłych użytkowników i scenariuszy biurowych „autonomicznego AI cyfrowego pracownika”, która przekształca Copilot z „asystenta czatu” w „agenta, który może nam pomóc w pracy”.
W zeszłym tygodniu rozmawialiśmy o dynamice Microsoftu, a jego wskaźnik ceny do zysku wrócił do najniższego poziomu w ciągu ostatnich dziesięciu lat, wchodząc w zakres opłacalności. Wprowadzenie Copilot Tasks sprawia, że ta opłacalność wydaje się jeszcze bardziej atrakcyjna. W tym roku wielkie firmy technologiczne przyspieszają wdrażanie agentów AI, a scenariusze biurowe i produktywnościowe są kluczowymi obszarami, w które inwestują. W przypadku scenariuszy biurowych i produktywnościowych, Microsoft ma największą przewagę.

181
Najlepsze
Ranking
Ulubione