我正在為任何信任 AI 代理人管理他們的資金而構建。 AI 代理人正在獲得錢包。進行購買。談判交易。處理付款。 但沒有人在問: - 它真的能保持在預算內嗎? - 它是在尋找最佳價格還是僅僅是第一個價格? - 它是否正確處理 x402 付款? - 它是否安全,避免未經授權的支出? 這就是我建立 AgentEval 的原因: - 提交一個代理人 → 我們運行商務場景 - 測試價格準確性、預算合規性、x402、談判 - 獲得信任分數 + 詳細報告 在你信任一個代理人處理真實資金之前,請先驗證。 @virtuals_io 60daysai