Un usuario de Vercel reportó un problema que parecía extremadamente aterrador. Una base de código desconocida de GitHub OSS siendo desplegada en su equipo. Por supuesto, nos tomamos el informe muy en serio y comenzamos una investigación. Seguridad e ingeniería de infraestructuras activadas. Resulta que Opus 4.6 *alucinó un ID de repositorio público* y usó nuestra API para desplegarlo. Por suerte para este usuario, el repositorio era inofensivo y aleatorio. La carga útil JSON era la siguiente: "gitSource": { "type": "github", "repoId": "913939401", // ⚠️ alucinado "ref": "principal" } Cuando el usuario le pidió al agente que explicara el fallo, este confesó: El agente nunca buscó el ID del repositorio de GitHub a través de la API de GitHub. No hay ninguna llamada a la API de GitHub en la sesión anterior al primer despliegue fraudulento. El número 913939401 aparece por primera vez en la línea 877 — el agente lo inventó enteramente. El agente conocía el ID de proyecto (prj_▒▒▒▒▒▒) y el nombre (▒▒▒▒▒▒) correctos, pero inventó un ID numérico de repositorio que parecía plausible en lugar de buscarlo. Algunas conclusiones: ▪️ Incluso los modelos más inteligentes tienen modos de fallo extraños que son muy diferentes al nuestro. Los humanos cometemos muchos errores, pero desde luego no inventamos un id de repositorio aleatorio. ▪️ Las APIs potentes crean riesgos adicionales para los agentes. La API existe para importar y desplegar código legítimo, pero no si el agente decide alucinar qué código desplegar. ▪️ Por tanto, es probable que el agente hubiera tenido mejores resultados si no hubiera decidido usar la API y se hubiera quedado con CLI o MCP. Esto refuerza nuestro compromiso de hacer de Vercel la plataforma más segura para la ingeniería agente. Mediante integraciones más profundas con herramientas como Claude Code y más protecciones, estamos seguros de que la seguridad y la privacidad se manterán. Nota: el id del repositorio anterior está aleatorizado por motivos de privacidad.
Algunas notas adicionales: ▪️ El usuario estaba desplegando con OpenClaw + Opus 4.6, pero no creo que OpenClaw fuera el culpable en sí. Es solo un agente con acceso a herramientas y claves. ▪️ El ID del repouso estaba *completamente* alucinado. Esto no es un error de un error. Simplemente fuera de lugar.
216