Apenas um lembrete de que na verdade não sabemos muito sobre o alinhamento prático de agentes. AIs individuais são difíceis o suficiente, mas os agentes captam contexto uns dos outros, de prompts potencialmente hostis, do ambiente, de longas execuções autônomas, muitos têm pesos abertos, etc.
Alexander Long
Alexander LongHá 13 horas
sequência insana de declarações enterradas em um relatório técnico da Alibaba
Para ser claro, também não sabemos muito sobre o alinhamento mais profundo das AIs.
41