Juste un rappel que nous ne savons en réalité pas grand-chose sur l'alignement pratique des agents. Les IA individuelles sont déjà assez difficiles, mais les agents s'influencent les uns les autres, par des prompts potentiellement hostiles, par l'environnement, lors de longues exécutions autonomes, beaucoup ont des poids ouverts, etc.
Alexander Long
Alexander Longil y a 12 heures
séquence folle d'affirmations enfouies dans un rapport technologique d'Alibaba
Pour être clair, nous ne savons pas non plus grand-chose sur l'alignement plus profond des IA.
39