Un usuario de Vercel informó de un problema que sonaba extremadamente aterrador. Un código base OSS desconocido de GitHub se estaba desplegando en su equipo. Por supuesto, tomamos el informe muy en serio y comenzamos una investigación. Se involucró a ingeniería de seguridad e infraestructura. Resulta que Opus 4.6 *alucinó un ID de repositorio público* y utilizó nuestra API para desplegarlo. Afortunadamente para este usuario, el repositorio era inofensivo y aleatorio. La carga útil de JSON se veía así: "𝚐𝚒𝚝𝚂𝚘𝚞𝚛𝚌𝚎": { "𝚝𝚢𝚙𝚎": "𝚐𝚒𝚝𝚑𝚞𝚋", "𝚛𝚎𝚙𝚘𝙸𝚍": "𝟿𝟷𝟹𝟿𝟹𝟿𝟺𝟶𝟷", // ⚠️ 𝚑𝚊𝚕𝚕𝚞𝚌𝚒𝚗𝚊𝚝𝚎𝚍 "𝚛𝚎𝚏": "𝚖𝚊𝚒𝚗" } Cuando el usuario le pidió al agente que explicara la falla, confesó: El agente nunca buscó el ID del repositorio de GitHub a través de la API de GitHub. No hay llamadas a la API de GitHub en la sesión antes del primer despliegue rebelde. El número 913939401 aparece por primera vez en la línea 877 — el agente lo fabricó completamente. El agente conocía el ID de proyecto correcto (prj_▒▒▒▒▒▒) y el nombre del proyecto (▒▒▒▒▒▒) pero inventó un ID de repositorio numérico que parecía plausible en lugar de buscarlo. Algunas conclusiones: ▪️ Incluso los modelos más inteligentes tienen modos de falla extraños que son muy diferentes a los nuestros. Los humanos cometen muchos errores, pero ciertamente no inventan un ID de repositorio aleatorio. ▪️ Las APIs poderosas crean riesgos adicionales para los agentes. La API existe para importar y desplegar código legítimo, ¡pero no si el agente decide alucinar qué código desplegar! ▪️ Por lo tanto, es probable que el agente hubiera tenido mejores resultados si no hubiera decidido usar la API y se hubiera quedado con CLI o MCP. Esto refuerza nuestro compromiso de hacer de Vercel la plataforma más segura para la ingeniería agente. A través de integraciones más profundas con herramientas como Claude Code y guardrails adicionales, estamos seguros de que la seguridad y la privacidad se mantendrán. Nota: el ID del repositorio anterior está aleatorizado por razones de privacidad.
Algunas notas adicionales: ▪️ El usuario estaba implementando con OpenClaw + Opus 4.6, pero no creo que OpenClaw fuera el culpable aquí per se. Es solo un agente con acceso a herramientas y claves. ▪️ La ID del repositorio fue *completamente* alucinada. No es un error de uno fuera. Simplemente está completamente fuera.
216