Recetas practicas

Usa workflow recipes cuando la pregunta es como operar la lane, no solo que modelo o proveedor comprar.

Esta pagina convierte problemas repetidos en patrones operativos acotados para coding review, research, retrieval, browser agents, analisis multimodal y despliegue local-first.

ℹ️

Reglas del snapshot local

Workflow Recipes es la capa operativa. Usa un snapshot local 2026-03 y conviene abrirla cuando proveedor y modelo ya estan mas recortados. Si la pregunta sigue siendo vendor, escenario o ficha tecnica, vuelve antes a la ruta LLM. Si el cuello de botella es serving local o coste de hardware, salta a Inference Hardware Guide.

Recetas vivas

Rutas accionables

Rutas de bajo coste

Buenas para workers o local-first

Rutas complejas

Piden mas control o tooling

Rutas local-first

Privacidad o self-host

Como leer esta board operativa

1

Problema

Empieza por la restriccion operativa

Elige la receta por el cuello de botella real: coste de review, calidad de retrieval, input multimodal o control.
2

Stack

Separa lanes de workers de lanes de cierre

Los flujos utiles suelen dividir workers baratos, planners fuertes y puertas de validacion reales.
3

Validacion

Mantiene visibles tests, checkpoints o evidencia grounded

Un workflow sin validacion real es una demo, no una ruta operativa.

Ruta LLM

Vuelve a la capa de routing si todavia necesitas aclarar si el problema es vendor, modelo o escenario.

Abrir ruta LLM

Agent stack board

Abre la capa de stack cuando la receta se bloquea por arquitectura, gobierno u orquestacion browser.

Abrir stack board

Model fit radar

Usa picks de modelo por escenario cuando la receta ya esta clara pero la lane de modelo todavia no.

Abrir radar

Inference guide

Abre hardware cuando la receta ya esta limitada por serving local, VRAM, RAM o presupuesto energetico.

Abrir hardware

Coding review

Loop de revision de codigo con worker barato y cierre fuerte

Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.

Research

Research y sintesis con planner largo y salida ejecutiva

Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.

Retrieval

Retrieval mas tools para flujos con grounding real

Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.

Browser agents

Flow de navegador con agentes y cierres humanos

Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.

Multimodal

Analisis multimodal con una lane fuerte y salida compacta

Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.

Local-first

Workflow local-first para privacidad, edge y control

Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.

Board operativa

Recetas que responden que conviene ejecutar despues

Mapa practico de lanes

Receta	Stack recomendado	Modelo y proveedor	Perfil de decision	Cautela principal
Coding review Loop de revision de codigo con worker barato y cierre fuerte Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.	Worker economico para triage de diffs y smell detection Planner fuerte para riesgos, regresiones y respuesta final Tests y lint como puerta obligatoria antes del cierre	Modelo: GPT-5.4 mini para workers y GPT-5.4 para cierre o review final. Proveedor: OpenAI encaja mejor cuando el loop depende de tooling, repo context y cierre fuerte.	Media Media Media	No dejes la respuesta final en manos del worker barato. Si no hay tests, el loop produce falsa confianza muy rapido.
Research Research y sintesis con planner largo y salida ejecutiva Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.	Busqueda o captura de fuentes separada de la sintesis Planner con contexto largo para consolidar hallazgos Formato final en memo o tabla antes de publicar	Modelo: GPT-5.4 como planner principal y Gemini 2.5 Flash-Lite si necesitas una pasada barata de clasificacion. Proveedor: OpenAI para razonamiento sostenido; Google como apoyo cuando importa throughput de lectura.	Media-alta Media Media	No uses una sola pasada para recoger fuentes y decidir. Si pides demasiada prosa, la utilidad cae aunque el razonamiento sea bueno.
Retrieval Retrieval mas tools para flujos con grounding real Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.	Retriever o busqueda hibrida con filtros simples Tool layer para acciones externas o consultas verificables Modelo de sintesis separado del retrieval	Modelo: Gemini 2.5 Flash-Lite o GPT-5.4 mini para retrieval workers; GPT-5.4 para sintesis delicada. Proveedor: Google y OpenAI funcionan bien si separas worker barato y capa final; la clave es el diseno del retrieval.	Media Media Alta	Mas contexto no arregla un retrieval mal planteado. Si la tool layer no audita bien, el flujo parece seguro pero no lo es.
Browser agents Flow de navegador con agentes y cierres humanos Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.	Worker de browser para exploracion y captura Planner separado para decidir el siguiente paso Checkpoint humano o regla fuerte antes de acciones sensibles	Modelo: GPT-5.4 mini para workers de navegador y GPT-5.4 para planner o aprobador. Proveedor: OpenAI encaja mejor cuando el flujo depende de tool use iterativo y salidas controladas.	Media Media-alta Alta	No confundas observacion con ejecucion automatica segura. Las UIs inestables disparan coste y error si el flujo no esta acotado.
Multimodal Analisis multimodal con una lane fuerte y salida compacta Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.	Una lane multimodal fuerte para la lectura principal Resumen textual corto y accionable como salida base Ruta secundaria de verificacion si la pieza es critica	Modelo: Gemini 2.5 Pro como primera opcion; GPT-5.4 mini solo si el input visual es ligero. Proveedor: Google conviene mas cuando el problema es multimodal de verdad y no solo texto con imagen decorativa.	Media-alta Media Media	No metas multimodalidad si el caso real es texto y tabla. Sin una salida compacta, el usuario acaba con una descripcion bonita pero poco util.
Local-first Workflow local-first para privacidad, edge y control Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.	Modelo open-weight o self-host como lane primaria Fallback remoto solo para casos premium o validacion final Observabilidad simple sobre coste, latencia y calidad	Modelo: Mistral Large 3 o Ministral 3 8B segun calidad deseada y huella operativa. Proveedor: Mistral encaja mejor cuando la estrategia open-weight o private cloud es una decision real, no un eslogan.	Competitiva Variable Alta	Local-first no significa local-only: reserva una salida para casos complejos. Si no mides hardware y throughput, el argumento de coste se vuelve retorico.

Coding review

Loop de revision de codigo con worker barato y cierre fuerte

Media

Problema: Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.

Stack recomendado

Worker economico para triage de diffs y smell detection
Planner fuerte para riesgos, regresiones y respuesta final
Tests y lint como puerta obligatoria antes del cierre

Pasos del flujo

Recorta el diff en bloques y pide a un worker barato riesgos, huecos de pruebas y archivos criticos.
Pasa solo los hallazgos fuertes al planner o reviewer principal.
Ejecuta pruebas reales antes de convertir el review en decision final.

Modelo: GPT-5.4 mini para workers y GPT-5.4 para cierre o review final.

Proveedor: OpenAI encaja mejor cuando el loop depende de tooling, repo context y cierre fuerte.

Media Media Media

Cautelas

No dejes la respuesta final en manos del worker barato.
Si no hay tests, el loop produce falsa confianza muy rapido.

Research

Research y sintesis con planner largo y salida ejecutiva

Media-alta

Problema: Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.

Stack recomendado

Busqueda o captura de fuentes separada de la sintesis
Planner con contexto largo para consolidar hallazgos
Formato final en memo o tabla antes de publicar

Pasos del flujo

Separa captura de fuentes y sintesis para no mezclar evidencia con resumen demasiado pronto.
Marca contradicciones y huecos antes de escribir la conclusion.
Cierra con una salida ejecutiva corta y una lista de validaciones pendientes.

Modelo: GPT-5.4 como planner principal y Gemini 2.5 Flash-Lite si necesitas una pasada barata de clasificacion.

Proveedor: OpenAI para razonamiento sostenido; Google como apoyo cuando importa throughput de lectura.

Media-alta Media Media

Cautelas

No uses una sola pasada para recoger fuentes y decidir.
Si pides demasiada prosa, la utilidad cae aunque el razonamiento sea bueno.

Retrieval

Retrieval mas tools para flujos con grounding real

Media

Problema: Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.

Stack recomendado

Retriever o busqueda hibrida con filtros simples
Tool layer para acciones externas o consultas verificables
Modelo de sintesis separado del retrieval

Pasos del flujo

Recupera pocos bloques buenos antes de ampliar el contexto.
Usa tools para verificar o actuar y deja rastros claros de cada llamada.
Pide una sintesis final que cite limites y lagunas del grounding.

Modelo: Gemini 2.5 Flash-Lite o GPT-5.4 mini para retrieval workers; GPT-5.4 para sintesis delicada.

Proveedor: Google y OpenAI funcionan bien si separas worker barato y capa final; la clave es el diseno del retrieval.

Media Media Alta

Cautelas

Mas contexto no arregla un retrieval mal planteado.
Si la tool layer no audita bien, el flujo parece seguro pero no lo es.

Browser agents

Flow de navegador con agentes y cierres humanos

Media

Problema: Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.

Stack recomendado

Worker de browser para exploracion y captura
Planner separado para decidir el siguiente paso
Checkpoint humano o regla fuerte antes de acciones sensibles

Pasos del flujo

Explora la UI con pasos cortos y captura evidencia antes de actuar.
Haz que el planner resuma estado, riesgos y siguiente accion.
Bloquea submits o cambios destructivos detras de una aprobacion clara.

Modelo: GPT-5.4 mini para workers de navegador y GPT-5.4 para planner o aprobador.

Proveedor: OpenAI encaja mejor cuando el flujo depende de tool use iterativo y salidas controladas.

Media Media-alta Alta

Cautelas

No confundas observacion con ejecucion automatica segura.
Las UIs inestables disparan coste y error si el flujo no esta acotado.

Multimodal

Analisis multimodal con una lane fuerte y salida compacta

Media-alta

Problema: Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.

Stack recomendado

Una lane multimodal fuerte para la lectura principal
Resumen textual corto y accionable como salida base
Ruta secundaria de verificacion si la pieza es critica

Pasos del flujo

Define primero que senales importan y que salida accionable necesitas.
Procesa el activo multimodal en una sola lane fuerte antes de resumir.
Baja a formato memo, checklist o scorecard para que la decision sea util.

Modelo: Gemini 2.5 Pro como primera opcion; GPT-5.4 mini solo si el input visual es ligero.

Proveedor: Google conviene mas cuando el problema es multimodal de verdad y no solo texto con imagen decorativa.

Media-alta Media Media

Cautelas

No metas multimodalidad si el caso real es texto y tabla.
Sin una salida compacta, el usuario acaba con una descripcion bonita pero poco util.

Local-first

Workflow local-first para privacidad, edge y control

Competitiva

Problema: Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.

Stack recomendado

Modelo open-weight o self-host como lane primaria
Fallback remoto solo para casos premium o validacion final
Observabilidad simple sobre coste, latencia y calidad

Pasos del flujo

Define que tareas deben quedarse locales y cuales pueden escalar a remoto.
Dimensiona la lane local para el caso base, no para el benchmark mas extremo.
Mide latencia, calidad y coste antes de activar un fallback frontier.

Modelo: Mistral Large 3 o Ministral 3 8B segun calidad deseada y huella operativa.

Proveedor: Mistral encaja mejor cuando la estrategia open-weight o private cloud es una decision real, no un eslogan.

Competitiva Variable Alta

Cautelas

Local-first no significa local-only: reserva una salida para casos complejos.
Si no mides hardware y throughput, el argumento de coste se vuelve retorico.

Como leer esta board operativa

Empieza por la restriccion operativa

Separa lanes de workers de lanes de cierre

Mantiene visibles tests, checkpoints o evidencia grounded

Ruta LLM

Agent stack board

Model fit radar

Inference guide

Loop de revision de codigo con worker barato y cierre fuerte

Research y sintesis con planner largo y salida ejecutiva

Retrieval mas tools para flujos con grounding real

Flow de navegador con agentes y cierres humanos

Analisis multimodal con una lane fuerte y salida compacta

Workflow local-first para privacidad, edge y control

Recetas que responden que conviene ejecutar despues

Loop de revision de codigo con worker barato y cierre fuerte

Research y sintesis con planner largo y salida ejecutiva

Retrieval mas tools para flujos con grounding real

Flow de navegador con agentes y cierres humanos

Analisis multimodal con una lane fuerte y salida compacta

Workflow local-first para privacidad, edge y control