Usar memoria
Elige memoria solo cuando la continuidad de tarea compensa la carga de estado
Si el agente tiene que volver sobre trabajo, preservar contexto o mantener hilos largos, la memoria se justifica. Si no, los pipelines son mas simples.
Este board separa pipelines, stacks con retrieval, agentes con memoria, orquestadores multiagente, coding agents, browser automation y local-first antes de empezar a implementar.
Familias comparadas
Arquetipos de stack
Rutas de alto control
Deterministas o muy gobernadas
Rutas con memoria
Importa estado o persistencia
Rutas de alta complejidad
Multiagente o browser intensivo
Usar memoria
Si el agente tiene que volver sobre trabajo, preservar contexto o mantener hilos largos, la memoria se justifica. Si no, los pipelines son mas simples.
Usar multiagente
Si no puedes definir ownership, handoffs y validacion, un agente con estado suele ser la opcion mas clara.
Usar browser stacks
Si existe una API suficiente, la automatizacion de navegador deberia quedarse fuera del camino critico.
| Familia de stack | Usalo cuando | Control y memoria | Presupuesto y complejidad | Cautela |
|---|---|---|---|---|
| Simple pipelines Temporal, n8n, Queues + workers | Usalo cuando el problema real es coordinar tareas fiables, no simular autonomia Flujos repetibles, aprobaciones, ETL operativa y automatizacion con pasos claros | Alta y determinista No requiere memoria conversacional | Baja-media Predecible | Si metes demasiada autonomia en un pipeline fijo, complicas soporte sin ganar mucho Fuente oficial: Temporal docs |
| Retrieval + tools stacks LlamaIndex, PydanticAI, LangGraph | Usalo cuando necesites herramientas y retrieval antes que un enjambre de agentes Copilots con grounding, asistentes internos y workflows donde importa usar datos propios | Alta si defines retrieval, tools y guardrails Memoria ligera o contextual | Media Media y controlable | La calidad cae rapido si retrieval, ranking y tool policy no estan bien definidos Fuente oficial: LlamaIndex docs |
| Stateful single agents LangGraph, PydanticAI, Custom memory store | Usalo cuando un solo agente con memoria basta y un multiagente seria sobreingenieria Agentes que vuelven sobre el trabajo, recuerdan contexto y necesitan continuidad de tarea | Alta con buena capa de estado Memoria persistente o de sesion | Media-alta Variable | La memoria sin politica clara genera acumulacion de contexto y decisiones inconsistentes Fuente oficial: LangGraph docs |
| Multi-agent orchestrators CrewAI, AutoGen, LangGraph supervisor | Usalo cuando una sola loop no basta y puedes definir ownership, handoffs y validacion Problemas complejos con roles distintos, paralelismo real y necesidad de coordinacion | Media-alta, depende de ownership y mensajes Memoria compartida o por agente | Alta Alta si no hay routing duro | Si no hay ownership de archivos, trazabilidad y limites de autonomia, el coste explota Fuente oficial: CrewAI docs |
| Coding agents Codex CLI, Claude Code, Repo tool runners | Usalo cuando el centro de gravedad es el repositorio y no una UI conversacional Refactors acotados, test generation, code review y ejecucion guiada por herramientas | Alta si el repo tiene checks y ownership Contexto de repo y tarea | Media Media-alta segun modelo | Sin build, tests y diffs pequenos, el throughput se convierte en deuda tecnica Fuente oficial: PydanticAI docs |
| Browser and computer-use stacks Playwright, Browser tool runners, Computer-use loops | Usalo cuando la unica verdad esta en la interfaz y no hay API suficiente Web ops, QA, formularios, scraping guiado y tareas donde la UI es parte del trabajo | Media si no hay asserts y snapshots Memoria corta y estado de navegador | Alta Media-alta por fragilidad operativa | Es la familia mas sensible a cambios de UI, auth y flujos no deterministas Fuente oficial: Playwright docs |
| Local-first agent stacks Ollama, Local tool runners, Private vector stores | Usalo cuando residencia de datos, coste recurrente o autonomia local pesan mas que el ultimo benchmark Privacidad, soberania, edge y equipos que aceptan sacrificar algo de frontier a cambio de control | Muy alta Memoria y datos bajo control local | Media-alta Capex primero, opex bajo | Hardware, observabilidad y mantenimiento de modelos pasan a ser parte del producto Fuente oficial: Ollama docs |
Simple pipelines
Usalo cuando: Usalo cuando el problema real es coordinar tareas fiables, no simular autonomia
Mejor para: Flujos repetibles, aprobaciones, ETL operativa y automatizacion con pasos claros
Control: Alta y determinista
Memoria: No requiere memoria conversacional
Complejidad: Baja-media
Presupuesto: Predecible
Cautela: Si metes demasiada autonomia en un pipeline fijo, complicas soporte sin ganar mucho
Fuente oficialRetrieval + tools stacks
Usalo cuando: Usalo cuando necesites herramientas y retrieval antes que un enjambre de agentes
Mejor para: Copilots con grounding, asistentes internos y workflows donde importa usar datos propios
Control: Alta si defines retrieval, tools y guardrails
Memoria: Memoria ligera o contextual
Complejidad: Media
Presupuesto: Media y controlable
Cautela: La calidad cae rapido si retrieval, ranking y tool policy no estan bien definidos
Fuente oficialStateful single agents
Usalo cuando: Usalo cuando un solo agente con memoria basta y un multiagente seria sobreingenieria
Mejor para: Agentes que vuelven sobre el trabajo, recuerdan contexto y necesitan continuidad de tarea
Control: Alta con buena capa de estado
Memoria: Memoria persistente o de sesion
Complejidad: Media-alta
Presupuesto: Variable
Cautela: La memoria sin politica clara genera acumulacion de contexto y decisiones inconsistentes
Fuente oficialMulti-agent orchestrators
Usalo cuando: Usalo cuando una sola loop no basta y puedes definir ownership, handoffs y validacion
Mejor para: Problemas complejos con roles distintos, paralelismo real y necesidad de coordinacion
Control: Media-alta, depende de ownership y mensajes
Memoria: Memoria compartida o por agente
Complejidad: Alta
Presupuesto: Alta si no hay routing duro
Cautela: Si no hay ownership de archivos, trazabilidad y limites de autonomia, el coste explota
Fuente oficialCoding agents
Usalo cuando: Usalo cuando el centro de gravedad es el repositorio y no una UI conversacional
Mejor para: Refactors acotados, test generation, code review y ejecucion guiada por herramientas
Control: Alta si el repo tiene checks y ownership
Memoria: Contexto de repo y tarea
Complejidad: Media
Presupuesto: Media-alta segun modelo
Cautela: Sin build, tests y diffs pequenos, el throughput se convierte en deuda tecnica
Fuente oficialBrowser and computer-use stacks
Usalo cuando: Usalo cuando la unica verdad esta en la interfaz y no hay API suficiente
Mejor para: Web ops, QA, formularios, scraping guiado y tareas donde la UI es parte del trabajo
Control: Media si no hay asserts y snapshots
Memoria: Memoria corta y estado de navegador
Complejidad: Alta
Presupuesto: Media-alta por fragilidad operativa
Cautela: Es la familia mas sensible a cambios de UI, auth y flujos no deterministas
Fuente oficialLocal-first agent stacks
Usalo cuando: Usalo cuando residencia de datos, coste recurrente o autonomia local pesan mas que el ultimo benchmark
Mejor para: Privacidad, soberania, edge y equipos que aceptan sacrificar algo de frontier a cambio de control
Control: Muy alta
Memoria: Memoria y datos bajo control local
Complejidad: Media-alta
Presupuesto: Capex primero, opex bajo
Cautela: Hardware, observabilidad y mantenimiento de modelos pasan a ser parte del producto
Fuente oficialRuta
Vuelve a la capa de routing si el bloqueo sigue siendo vendor, detalle tecnico de modelo o alcance de workflow.
Ruta
Usa picks por escenario cuando la familia de stack ya esta clara pero no la lane de modelo por defecto.
Ruta
Salta a hardware cuando private serving, VRAM o la forma de la workstation ya limitan el stack.
Ruta
Usa recetas operativas cuando la familia ya esta elegida y la siguiente pregunta es como ejecutarla.
Ruta
Vuelve al mapa de frameworks cuando la familia ya esta decidida y necesitas contexto de tooling.