Cómo gobierno una flota de agentes de IA en el repo de mi propio producto

No es vibe-coding. Es un sistema con contratos, puertas de seguridad y una revisión humana que nunca se salta.

Rol: Ingeniería en solitario
Trabajos cerrados: +230
Stack: Astro · React · TS
Estado: En producción

El problema

La IA es rápida, incansable y, sin un marco, también rápida e incansable rompiendo cosas. Lo que importa no es el prompt: es el sistema alrededor del agente.

El sistema

Cuatro capas que hacen que la autonomía sea segura.

El estado vive en los archivos

Cada trabajo es un ticket; la carpeta donde vive es su estado. Nada se cierra sin un «teatro» de QA que lo demuestra. +230 cerrados así.

Puerta de seguridad binaria

Antes de tocar nada: agent-ok o human-required. Auth, pagos, base de datos, secretos → siempre humano. No hay zona gris.

El agente nunca hace merge

Implementa, abre una PR y se detiene. Reviso y mergeo yo. Si algo se degrada, lo veo como «una PR que rechazo», nunca como código malo en producción.

Un test que vigila si la IA se degrada

Casos de oro congelados: al cambiar las reglas del agente, re-resuelve esos casos y compruebo que sus tests siguen pasando. Regresión, pero del comportamiento del agente.

La parte honesta

Resultado

+230

trabajos cerrados, cada uno con revisión humana

merges de agente — solo PRs que yo apruebo

capas de gobierno: contrato · puerta · PR · test de regresión

Trabaja conmigo

Un producto real en producción, construido solo, con un estándar que la mayoría de equipos no tiene. ¿Lo quieres en el tuyo?

Hablemos Trabaja conmigo