Del council a producción: lanzando 38 proyectos de IA en 60 días

Hace dos meses me comprometí con un pequeño experimento: en vez de generar nuevas ideas de proyectos como siempre (abrir un doc, mirarlo, terminar deslizándome a Twitter), iba a dejar que un sistema multiagente eligiera por mí. Council —ocho agentes proponentes, un pipeline de fact-check, un debate estructurado y un juez calibrador— se reuniría, votaría y me entregaría las tres mejores ideas cada día.

El trato era simple: yo construía la idea #1 casi todos los días. Sin cuestionar a los agentes. Sin re-correr hasta que me gustara el resultado.

Sesenta días después, el portafolio pasó de 6 proyectos en producción a 44. Este post es lo que aprendí dejando que un sistema de IA marcara el roadmap, y lo que realmente costó entregarlos.

Cómo decide el Council

Ocho agentes especializados (Researcher, Creative, Analyst, Financial, Customer, Competitive, Physical, Trend Forecaster) proponen un proyecto cada uno, desde perspectivas distintas. El agente Customer lee Reddit y detecta dolores reales. El Competitive mapea el panorama y busca huecos sin defender. El Trend Forecaster lee actividad de VC y patentes para sesgar hacia lo que importará en 6–12 meses.

Después las propuestas pasan por un pipeline de 10 fases:

Polinización cruzada — los agentes leen los borradores de los demás y revisan.
Fact check — cada afirmación numérica se valida con búsqueda web en vivo.
Crítica — el agente Contrarian ataca cada propuesta.
Defensa — el Advocate construye el contraargumento más fuerte.
Debate estructurado — pros y contras se argumentan por escrito.
Calibración — los puntajes se normalizan entre agentes.
Juicio — veredicto imparcial con scores de confianza.
Síntesis — top 3 con razonamiento.
Veto — disensos minoritarios marcados.
Plan de negocio — autogenerado para la #1.

Todo corre en menos de 4 minutos por ~$0.40 USD de Claude API. Con --deep (Opus en vez de Sonnet) corre ~12 minutos por ~$2.

Qué se eligió, y por qué

Mirando 31 sesiones, surgieron tres patrones:

1. Cumplimiento y trust de desarrollo ganaron al inicio

Las sesiones de marzo estuvieron dominadas por proyectos de cumplimiento y trust: DevTrust Shield (verificación de código en industrias reguladas), AI Compliance Navigator (regulaciones de IA estatales), CodeTrust (verificación multi-agente de código generado por IA), RegBot (OS de cumplimiento para startups), ComplianceBot (cumplimiento bilingüe para SMBs hispanohablantes en EE.UU.) y ComplianceAPI Hub (NOM/CFDI/IMSS/COFEPRIS de México como un solo API).

Esto no fue un tema que yo hubiera elegido —los agentes lo seguían levantando porque el agente Customer encontraba las mismas quejas en subreddits de fintech y healthtech semana tras semana.

2. La inteligencia de costos se volvió categoría

Conforme el gasto en Claude API crecía, el council empezó a recomendar infraestructura de control de costos: CostGuard (circuit breakers por agente en tiempo real), AgentSafe (monitoreo de costo + seguridad en runtime), APIRouter (enrutamiento costo-calidad entre proveedores), CostIntel (inteligencia de costos DevOps con detección de zombies) y GreenCompute (enrutamiento optimizado por energía). No eran ideas separadas —son un stack.

3. Vertical SaaS para México, una vez que el council aprendió mi contexto

Hacia el 4 de abril el council empezó a recomendar proyectos LATAM, casi seguro porque el agente Analyst (que escanea el entorno local) notó un cluster de trabajo en español y el Customer levantó dolores de SMBs mexicanas. De ahí salieron AgroFlow (cadena de suministro en Michoacán), FloraFlow (floricultura en Estado de México), GuadalajIT (inteligencia de nearshoring en Guadalajara), WaFlow (IA por WhatsApp para servicios en Morelia) y un stack vertical de salud (EntrenadorIA, FisioFlow, TerapiaFlow) para clínicas de Morelia.

Lo que en realidad costó entregar

La versión romántica es "los agentes proponen, el humano dispone." La realidad fue más cabezona.

La mayoría de los proyectos comparten un esqueleto. Python + Typer + Pydantic + Rich para el CLI, Claude API para la IA, FastAPI cuando hace falta capa web. Una vez que esa plantilla quedó sólida, los nuevos proyectos tardaron 2–6 horas en llegar a un demo funcional. El Council elige el destino; la plantilla lleva el coche.

Lo bilingüe no era negociable. Cada proyecto enfocado en México sale ES/EN desde el día uno —mensajes de error, prompts, contenido generado. Construir esto desde el inicio (en vez de pegárselo después) ahorró horas por proyecto.

El cumplimiento es feature, no una carga. El stack mexicano de fisio (FisioFlow, TerapiaFlow) genera notas SOAP que pasan auditorías NOM-004-SSA3. La facturación CFDI 4.0 vive en la capa de billing. Esto hace la diferencia entre "demo interesante" y "las clínicas sí van a pagar por esto."

Algunas elecciones del council no sobrevivieron al contacto con la realidad. El "Premium EV Charging Hub en Fremont" (rank 3, tres sesiones seguidas) es una gran idea — pero es un proyecto inmobiliario, no de software. Lo registré y seguí. El agente Physical sigue proponiendo plays de negocios físicos; yo los sigo guardando para después.

Lo que le diría a alguien que quiera intentarlo

Confía en los agentes para la dirección; en ti mismo para el alcance. El council es excelente eligiendo qué construir. Es mediocre dimensionando cuánto. Limita cada proyecto a lo que cabe en un fin de semana enfocado.
Deja que los agentes vean tu contexto. Las propuestas mejoraron muchísimo cuando el Analyst pudo leer mi directorio de desarrollo y el Creative pudo consultar mi Second Brain. El brainstorming genérico con LLM da output genérico.
Mantén apretado el presupuesto del modo deep. La mayoría de las sesiones no necesitan Opus. Reserva --deep para llamadas ambiguas donde el calibrador marca baja confianza.
Construye la plantilla primero. Un gran sistema agentico de decisiones no sirve si cada proyecto te toma una semana en arrancar.

Qué sigue

La siguiente ola es consolidación. Muchos de los 38 proyectos merecen fusionarse — el stack de control de costos (CostGuard / AgentSafe / APIRouter / CostIntel) ya se siente como una sola plataforma. El stack de salud en Morelia (EntrenadorIA / FisioFlow / TerapiaFlow) quiere convertirse en un solo OS para clínicas.

El propio council también recibe upgrades: un nuevo agente Memory que rastrea qué picks pasados se entregaron vs. se quedaron, y un agente Portfolio que marca cuando una nueva propuesta se traslapa demasiado con trabajo existente.

Si quieres ver el portafolio completo, está en /projects. Si quieres leer sobre proyectos específicos, los case studies en The Brainy Guys profundizan en algunos.

Del council a producción: lanzando 38 proyectos de IA en 60 días

Cómo decide el Council

Qué se eligió, y por qué

1. Cumplimiento y trust de desarrollo ganaron al inicio

2. La inteligencia de costos se volvió categoría

3. Vertical SaaS para México, una vez que el council aprendió mi contexto

Lo que en realidad costó entregar

Lo que le diría a alguien que quiera intentarlo

Qué sigue

¿Necesitas agentes de IA para tu negocio?

Recibe ideas de IA e ingeniería

Sigue leyendo

Vertical SaaS bilingüe para México: lo que aprendí construyendo 8 productos en 30 días

La geometría de todo: una síntesis de investigación de Riemann a los transformers