我构建了一个AI审计代理,在Sherlock比赛中达到了100%的精确度和52.9%的覆盖率。 然后我将其与@pashov的审计技能进行了基准测试。 结果并不接近,正如你在图片中看到的那样。 NEMESIS现在是开源的。 🧵