Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

qinbafrank
Investitor în Crypto, TMT, AI, urmărind cele mai avansate tendințe tehnologice, observații macro-politice și economice sălbatice, cercetarea lichidității capitalului global și investiții în tendințe ciclice. Înregistrați învățarea și gândirea personală, faceți adesea greșeli, cădeți în gropi și urcați gropi. Alergător🏃
Cum să menții continuitatea economică într-o lume turbulentă? Lumea trece de la o ordine condusă de reguli la una condusă de forță, iar conflictele geopolitice vor crește și vor deveni mai intense în viitor. Au trecut doar 2 luni de la începutul a 26 de ani și ar trebui să avem o înțelegere profundă a acestui lucru. În acest mediu, ca indivizi, mai ales pentru țări și oameni aflați în vârtejul conflictelor profunde: închiderile bancare, canalele de plată sunt întrerupte, sistemele de identitate sunt paralizate, iar chiar atentatele cu bombă bancare și distrugerea datelor (acest lucru s-a întâmplat anul trecut cu Banca Națională a Iranului) este extrem de mortală. Când descoperi că nu-ți poți dovedi identitatea, nu poți plăti sau chiar sistemul bancar are probleme, asta înseamnă probleme de continuitate economică. În acest moment, tendința prețurilor activelor este irelevantă, iar dacă economia poate continua a devenit un punct cheie.
Deci, cum să menții continuitatea economică? Multe țări și echipe tehnice explorează constant acest aspect. Căutând informații despre acest subiect, este interesant de observat că Acreditările Verificabile (VC) au fost lansate prin semn: nu doar o altă jucărie blockchain sofisticată, ci o soluție reală pentru continuitatea economică în timp de război.
Iată o scurtă prezentare despre cum se joacă:
1) Emitent: Guvernele, universitățile, instituțiile medicale, întreprinderile și alte instituții autoritare semnează acreditări cu chei private (cum ar fi statutul de rezident emis de stat, certificate de diplomă, dosare medicale, certificate imobiliare, permise de conducere, drepturi de acces la CBDC etc.).
2) Deținător: Cetățean/utilizator care stochează datele de autentificare în portofelul mobil sau digital și are control total asupra acestora.
3) Verificator: Orice instituție/serviciu (aeroport, bancă, angajator, spital etc.) care trebuie să confirme informațiile, să verifice direct semnătura + statutul de revocare local, fără a contacta emitentul sau a încărca datele pe serverul central. Astfel, evită și un singur punct de defectare
Principalele beneficii ale acestui design sunt protecția confidențialității și divulgarea selectivă. De exemplu, utilizatorii pot dovedi că au "peste 18 ani" fără a dezvălui data nașterii sau pot verifica că "dețin o diplomă valabilă" fără a dezvălui note specifice. Acest lucru evită riscurile de confidențialitate asociate cu replicarea datelor și proliferarea jurnalelor în sistemele tradiționale. În același timp, acreditările verificabile VC pot fi extinse în diverse situații, inclusiv deținerea imobiliarelor, permisele de conducere, certificatele de conformitate și chiar gestionarea certificatelor pentru active reale (RWA). Este, de asemenea, o formă de "pașaport on-chain"
Este echivalentul cu Verifiable Credentials care ne construiește un traseu parachain care nu depinde de nimeni: poate asigura plăți continue, identități și activități economice, în loc să fie aruncate în aer ca sistemele fizice tradiționale.
În acest sens, Verifiable Credentials vrea să nimerească foarte direct: în război, suveranitatea "devine brusc foarte reală" și trebuie să asigure că continuitatea economică rămâne indestructibilă chiar dacă infrastructura fizică este distrusă.
De aceea, Centrul Blockchain din Abu Dhabi, profund afectat de situația din Iran, a stabilit o alianță strategică cu semnele; Kârgâzstan, care este cel mai apropiat de Orientul Mijlociu, colaborează activ cu Digital Som într-un proiect pilot pentru moneda digitală a băncilor centrale naționale; Țara africană Sierra Leone folosește SignPass pentru a obține statutul de rezident on-chain pentru a proteja suveranitatea cetățenilor. Aceste țări au constatat că dependența de sistemele tradiționale centralizate de date prezintă riscuri semnificative în perioade de criză geopolitică. De asemenea, se gândesc și explorează capacitatea de a menține continuitatea economică în vremuri tulburi.
Prin urmare, alegerea fiecăruia va deveni din ce în ce mai pragmatică: nu este o luptă ideologică și nici cine poate face mai bine, ci trebuie să acordăm prioritate dacă putem accesa în siguranță și evita punctele unice de eșec.
Deși crud, trebuie să recunoaștem și că haosul este epoca de aur a forjării suveranității distribuite. Cine reușește să facă asta bine va avea mai mult spațiu. Din acest punct de vedere, viitorul Acreditărilor Verificabile este promițător.
325
Recent, s-a constatat că domeniul evaluării AI a intrat într-o etapă foarte matură și rapid iterativă. Reperele tradiționale (de exemplu, MMLU, HumanEval) tind să fie saturate, iar cadrele și metodologiile de generație următoare se concentrează pe capabilități din lumea reală (agenție, utilizare pe calculator, inferență multimodală), rigoare statistică, cuantificarea incertitudinii, securitate/încredere și provocări anti-contaminare/coadă lungă. Anterior, testam modele mari, iar acum testăm AI Agents. Aceste platforme ajută dezvoltatorii și companiile să testeze fiabilitatea, acuratețea, costurile, securitatea și performanța AI, de la iterarea dezvoltării până la implementarea în producție. Lăsați-l pe grok să se ocupe de lista celor mai populare platforme de evaluare AI


qinbafrank3 mar., 11:08
Care sunt aspectele cheie ale implementării AI la nivel enterprise? Spre deosebire de consumatorii care folosesc modele mari AI sau agenți AI, companiile implementează AI cu cerințe extrem de ridicate pentru medii de producție, documente dense și medii contextuale și necesită o acuratețe ridicată, o rată de eroare cât mai mică sau chiar zero. Pentru că nu este vorba de a lăsa AI să scrie poezii, să discute, să genereze imagini sau să rezolve probleme matematice, ci pentru a integra cu adevărat AI în procesul real de afaceri al operațiunii și producției de întreprindere sau companie, este pentru a permite AI să finalizeze munca complexă, plictisitoare și extrem de precisă pe care oamenii o fac în fiecare zi.
Este destul de interesant să vezi Arena lansată de SentientAGI. Oferă acestor agenți AI sarcini reale de dificultate (sau foarte simulate) de întreprindere, prin criterii stricte de punctare (cum ar fi acuratețea, completitudinea dovezilor, rata halucinațiilor, rata de acuratețe a citărilor, timpul de finalizare etc.), apoi înregistrează sistematic modurile de eșec (cum ar fi "fabricarea datelor din senin", "citarea surselor greșite", "salturile de raționament", "clauzele cheie lipsă"), și în final iterat și compară deschis pentru a permite dezvoltatorilor să vadă lacunele și să se îmbunătățească.
Pe scurt, Arena nu este un test al "dacă AI este inteligent sau nu", ci dacă poate înțelege cu acuratețe intențiile și poate îndeplini sarcini, testând practic dacă această inteligență artificială poate funcționa cu adevărat în companii mari, în special în acele legături și procese de lucru care sunt cele mai greu de automatizat și cele mai predispuse la accidente.
Din această perspectivă, Arena este o platformă de competiție unde dezvoltatorii supun agenților AI sarcinilor standardizate și compară rezultatele în condiții de testare consistente. Este ca o "competiție a agenților AI", unde agenții AI concurează corect cu același set de reguli în aceeași arenă. Platforma urmărește apoi categoriile de defecte precum halucinațiile, dovezile lipsă, citările incorecte și lacunele de inferență, permițând dezvoltatorilor să diagnosticheze probleme recurente.
Se pare că Sentient speră să forțeze comunitatea open source să atingă fiabilitatea, raționamentul pe lanț lung și auditabilitatea agenților AI într-un mediu real în care companiile îndrăznesc să intre în producție, în loc să rămână doar în etapele demo și clasament. Aceasta este cea care va ajuta cu adevărat la propulsarea AI către noul nivel de ultimă generație pentru sarcini reale de inferență la nivel enterprise.
Din această perspectivă, pot înțelege și de ce aceste mari instituții din domeniul investițiilor financiare, precum Franklin Templeton, Founders Fund, Pantera, OpenRouter etc., sunt dispuse să participe la cooperare, pentru că și ele sunt foarte preocupate de acest lucru, iar ceea ce interesează cu adevărat instituțiilor și întreprinderilor este dacă îndrăznesc să introducă inteligența artificială în procesul meu real de decizie de afaceri.
Încă aștept cu nerăbdare progrese suplimentare pe platforma Arena, care ar trebui să fie o parte foarte importantă a foaiei de parcurs "Open AGI" pe care Sentient dorește să o promoveze.
71
Microsoft este destul de dificil astăzi

qinbafrank5 mar., 00:44
Microsoft a lansat, de asemenea, propriul său agent AI, Copilot Tasks, care ar trebui considerat un pas important pentru ca Microsoft să intre în "Inteligența Artificială Agentică" și, în sfârșit, să țină pasul cu ritmul OpenAI, Anthropic, Google și alte companii. Totuși, în acest stadiu este deschis doar unui număr mic de utilizatori și trebuie să te înscrii pe lista de așteptare pentru a-l testa.
Privind demonstrația tweet-ului lui Nadrad, Copilot Tasks ar trebui să fie profund integrate cu Microsoft 365, capabile să opereze Outlook, Teams, Word, Excel etc. și să gestioneze sarcini complexe cu mai mulți pași (capabile să descompună pașii→ planificarea→ execuția → raportarea), punând accent pe "de la răspuns la acțiune"
Pare a fi versiunea Microsoft de "lucrători digitali AI autonomi" pentru utilizatori obișnuiți și scenarii de birou, actualizând Copilot de la un "asistent de chat" la un "agent care ne poate ajuta să lucrăm".
Săptămâna trecută, raportul dinamic preț-câștig al Microsoft a revenit la cel mai scăzut nivel din ultimul deceniu și a intrat în intervalul rentabil. Lansarea Copilot Tasks face ca acest aspect rentabil să pară și mai rentabil. Anul acesta, marile companii de tehnologie accelerează adoptarea agenților AI, iar scenariile de birou și productivitate sunt în centrul eforturilor fiecărei companii. În scenariul de productivitate la birou, Microsoft are cel mai mare avantaj.

97
Limită superioară
Clasament
Favorite