只是提醒一下,我们实际上对代理的实际对齐了解得并不多。单个 AI 已经够难了,但代理之间会相互获取上下文,可能来自敌对的提示、环境、长时间的自主运行,许多是开放权重,等等。
Alexander Long
Alexander Long11 小时前
在阿里巴巴的技术报告中埋藏着一系列疯狂的声明
明确来说,我们对人工智能的更深层次的对齐也了解不多。
32