Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

qinbafrank
Investidor em Crypto, TMT, IA, acompanhando as tendências tecnológicas mais avançadas, observação macro política e econômica selvagem, pesquisando liquidez de capital global, investimento de tendência cíclica. Registre o aprendizado pessoal e o pensamento, muitas vezes cometa erros, caia no poço e suba no poço normalmente. Corredor🏃
Como manter a continuidade econômica em um mundo turbulento? O mundo está passando de uma ordem dominada por regras para uma ordem dominada pela força, e os conflitos geopolíticos só tendem a aumentar e se intensificar no futuro. Com apenas 2 meses no ano de 2026, devemos ter uma profunda compreensão disso. Nesse ambiente, como indivíduos, especialmente para aqueles em países e pessoas profundamente imersas em conflitos: o fechamento de bancos, interrupção de canais de pagamento, colapso de sistemas de identidade e até mesmo bancos sendo bombardeados e dados destruídos (como ocorreu no ano passado com o Banco Nacional do Irã) é extremamente grave. Quando você descobre que não pode provar sua identidade, não consegue pagar, ou até mesmo o sistema bancário apresenta problemas, isso se torna um problema de continuidade econômica. Nesse momento, a tendência dos preços dos ativos já não é relevante; a capacidade de manter a economia em funcionamento se torna a questão crucial.
Então, como manter a continuidade econômica? Muitos países e equipes técnicas estão constantemente explorando essa questão. Ao pesquisar sobre o assunto, encontrei interessante o Verifiable Credentials (Credenciais Verificáveis, abreviado como VC) lançado pela sign: não é mais um brinquedo de blockchain chamativo, mas sim uma solução concreta para a continuidade econômica em tempos de guerra.
Vamos desmembrar como isso funciona:
1) issuer (emissor): governo, universidades, instituições de saúde, empresas e outras entidades autorizadas, que assinam o certificado uma única vez com uma chave privada (por exemplo, identidade de residente emitida pelo estado, diploma, registros médicos, comprovante de propriedade, carteira de motorista, acesso a CBDC, etc.).
2) Holder (detentor): cidadãos/usuários, que armazenam os certificados em suas carteiras de celular ou digitais, controlando totalmente.
3) Verifier (verificador): qualquer entidade/serviço que precise confirmar informações (aeroportos, bancos, empregadores, hospitais, etc.), que verifica localmente a assinatura + status de revogação, sem necessidade de contatar o emissor ou enviar dados para um servidor central. Isso também evita falhas de ponto único.
A principal vantagem desse design está na proteção da privacidade e na divulgação seletiva. Por exemplo, o usuário pode provar que "tem mais de 18 anos" sem revelar a data de nascimento, ou verificar que "possui um diploma válido" sem divulgar notas específicas. Isso evita os riscos de privacidade associados à cópia de dados e à disseminação de logs nos sistemas tradicionais. Além disso, as credenciais verificáveis suportam a expansão para vários cenários, incluindo propriedade imobiliária, carteira de motorista, comprovantes de conformidade e até mesmo gerenciamento de certificados de ativos do mundo real (RWA). Isso também é uma forma de "passaporte on-chain".
Equivale a dizer que as Credenciais Verificáveis estão construindo para nós uma trilha paralela que não depende de ninguém: garantindo que os pagamentos continuem, a identidade permaneça e as atividades econômicas não cessem, ao contrário dos sistemas físicos tradicionais que colapsam com uma explosão.
Nesse sentido, as Credenciais Verificáveis visam abordar um ponto crítico: em tempos de guerra, a soberania "de repente se torna muito real", necessitando garantir que mesmo que a infraestrutura física seja destruída, a continuidade econômica permaneça inabalável.
É por isso que o Centro de Blockchain de Abu Dhabi, profundamente afetado pela situação no Irã, estabeleceu uma aliança estratégica com a sign; o Quirguistão, o país mais próximo do Oriente Médio, está ativamente colaborando com a Digital Som para desenvolver um projeto piloto de moeda digital do banco central; e a Serra Leoa, na África, está implementando a identidade de residentes on-chain através do SignPass, para garantir a soberania do cidadão. Esses países perceberam que depender de sistemas de dados centralizados durante crises geopolíticas traz riscos significativos. Todos estão refletindo e explorando como manter a capacidade de continuidade econômica em tempos turbulentos.
Portanto, as escolhas de todos também se tornarão cada vez mais pragmáticas: não se trata de uma luta ideológica, nem de quem pode fazer melhor, mas de priorizar a segurança de acesso e evitar falhas de ponto único.
Embora seja cruel, também devemos admitir que a confusão é a era de ouro que forja a soberania distribuída. Quem conseguir fazer isso bem, terá mais espaço. Sob essa perspectiva, o futuro das Credenciais Verificáveis é promissor.
376
Recentemente, descobri que o campo da avaliação de IA entrou em uma fase de alta maturidade e rápida iteração. Os testes de referência tradicionais (como MMLU, HumanEval) estão se aproximando da saturação, enquanto a nova geração de estruturas e métodos se concentra em habilidades do mundo real (agente, uso de computador, raciocínio multimodal), rigor estatístico, quantificação de incerteza, segurança/confiabilidade e desafios de contaminação/cauda longa. Antes testávamos grandes modelos, agora testamos Agentes de IA. Essas plataformas ajudam desenvolvedores e empresas a realizar testes de confiabilidade, precisão, custo, segurança e desempenho da IA em toda a cadeia, desde o desenvolvimento e iteração até a implantação em produção. A grok organizou uma lista das plataformas de avaliação de IA mais populares.


qinbafrank3/03, 11:08
Quais são os principais aspectos da implementação de IA nas empresas? Ao contrário do uso de grandes modelos de IA ou agentes de IA pelos consumidores, a implementação de IA nas empresas exige um ambiente de produção altamente rigoroso, com documentação densa e contexto, necessitando de alta precisão e uma taxa de erro o mais baixa possível, ou até mesmo zero. Isso não se trata de fazer a IA escrever poesias, conversar, gerar imagens ou resolver problemas matemáticos, mas sim de realmente integrar a IA nos processos de negócios operacionais e produtivos de uma empresa, permitindo que a IA realize tarefas complexas, tediosas e que exigem alta precisão, que as pessoas fazem diariamente. Se não for possível garantir a precisão da IA, será difícil para as empresas implementá-la com confiança.
O Arena, lançado pela SentientAGI, parece bastante interessante. Ele apresenta tarefas empresariais reais (ou altamente realistas) para esses agentes de IA, com critérios de avaliação rigorosos (como precisão, integridade das evidências, taxa de alucinação, precisão das citações, tempo de conclusão, entre outros), e registra sistematicamente os padrões de falha (como "criação de dados do nada", "citação de fontes erradas", "saltos de raciocínio", "omissão de cláusulas-chave"), permitindo iterações contínuas e comparações públicas para que os desenvolvedores vejam as lacunas e melhorem.
Em resumo, o Arena não mede se a "IA é inteligente", mas sim se consegue entender intenções e executar tarefas com precisão, essencialmente avaliando se essa IA pode realmente trabalhar em grandes empresas, especialmente nas etapas e processos mais difíceis de automatizar e que são mais propensos a erros.
Sob essa perspectiva, o Arena é uma plataforma de competição, onde os desenvolvedores submetem agentes de IA a tarefas padronizadas e comparam resultados sob condições de teste consistentes. É como um "torneio de agentes de IA", onde cada agente de IA compete de forma justa sob as mesmas regras. A plataforma pode rastrear categorias de falhas, como alucinações, falta de evidências, citações incorretas e lacunas de raciocínio, permitindo que os desenvolvedores diagnostiquem problemas recorrentes.
Parece que a Sentient espera, por meio desse método, forçar a comunidade de código aberto a garantir a confiabilidade dos agentes de IA, raciocínio de longo prazo e auditabilidade, para que as empresas se sintam seguras em implementá-los em ambientes de produção reais, em vez de apenas ficarem na fase de demonstração e de pontuação em leaderboard. Isso é o que realmente pode ajudar a levar a IA a novos níveis de SOTA (state-of-the-art, estado da arte) em tarefas de raciocínio empresarial no mundo real.
Sob essa perspectiva, também se pode entender por que grandes instituições do setor financeiro, como Franklin Templeton, Founders Fund, Pantera, OpenRouter, entre outras, estão dispostas a colaborar, pois elas também estão muito atentas a isso. O que realmente importa para as instituições e empresas é se podem ou não integrar a IA em seus processos de decisão de negócios reais.
Estou ansioso por mais progressos na plataforma Arena, que deve ser uma parte muito crucial do roteiro "AGI aberto" que a Sentient deseja promover.
113
A Microsoft está bastante firme hoje.

qinbafrank5/03, 00:44
A Microsoft também lançou seu próprio agente de IA, o Copilot Tasks, que deve ser considerado um passo importante da Microsoft na entrada no "Agentic AI", finalmente conseguindo acompanhar empresas como OpenAI, Anthropic e Google. No entanto, neste estágio, está disponível apenas para um número limitado de usuários, sendo necessário entrar na lista de espera para testar.
Pelo que se pode ver na demonstração do tweet de Nadella, o Copilot Tasks deve estar profundamente integrado ao Microsoft 365, podendo operar o Outlook, Teams, Word, Excel, etc., lidando com tarefas complexas e em várias etapas (pode decompor etapas → planejar → executar → relatar), enfatizando "da resposta à ação".
Parece ser a versão da Microsoft voltada para usuários comuns e cenários de escritório do "trabalhador digital autônomo de IA", elevando o Copilot de "assistente de chat" para "um agente que pode nos ajudar a trabalhar".
Na semana passada, ao discutir a dinâmica da Microsoft, o seu índice preço-lucro já havia retornado ao ponto mais baixo dos últimos dez anos, entrando na faixa de custo-benefício. O lançamento do Copilot Tasks torna essa relação custo-benefício ainda mais atraente. Este ano, as grandes empresas de tecnologia estão acelerando a adoção de agentes de IA, e os cenários de escritório e produtividade são os principais focos de todas as empresas. E, no que diz respeito a cenários de produtividade no escritório, a Microsoft é a que tem a maior vantagem.

192
Top
Classificação
Favoritos