Cómo gobierno una flota de agentes de IA en el repo de mi propio producto
No es vibe-coding. Es un sistema con contratos, puertas de seguridad y una revisión humana que nunca se salta.
- Rol
- Ingeniería en solitario
- Trabajos cerrados
- +230
- Stack
- Astro · React · TS
- Estado
- En producción
La IA es rápida, incansable y, sin un marco, también rápida e incansable rompiendo cosas. Lo que importa no es el prompt: es el sistema alrededor del agente.
Cuatro capas que hacen que la autonomía sea segura.
El estado vive en los archivos
Cada trabajo es un ticket; la carpeta donde vive es su estado. Nada se cierra sin un «teatro» de QA que lo demuestra. +230 cerrados así.
Puerta de seguridad binaria
Antes de tocar nada: agent-ok o human-required. Auth, pagos, base de datos, secretos → siempre humano. No hay zona gris.
El agente nunca hace merge
Implementa, abre una PR y se detiene. Reviso y mergeo yo. Si algo se degrada, lo veo como «una PR que rechazo», nunca como código malo en producción.
Un test que vigila si la IA se degrada
Casos de oro congelados: al cambiar las reglas del agente, re-resuelve esos casos y compruebo que sus tests siguen pasando. Regresión, pero del comportamiento del agente.