Solo un recordatorio de que en realidad no sabemos mucho sobre la alineación práctica de los agentes. Las IAs individuales ya son bastante difíciles, pero los agentes captan contexto unos de otros, de prompts potencialmente hostiles, del entorno, de largas partidas autónomas, muchas son pesos abiertos, etc
Alexander Long
Alexander Longhace 16 horas
Secuencia loca de declaraciones enterradas en un informe técnico de Alibaba
Para que quede claro, tampoco sabemos mucho sobre la alineación más profunda de las IAs.
49