Recetas practicas

Usa workflow recipes cuando la pregunta es como operar la lane, no solo que modelo o proveedor comprar.

Esta pagina convierte problemas repetidos en patrones operativos acotados para coding review, research, retrieval, browser agents, analisis multimodal y despliegue local-first.

ℹ️

Reglas del snapshot local

Workflow Recipes es la capa operativa. Usa un snapshot local 2026-03 y conviene abrirla cuando proveedor y modelo ya estan mas recortados. Si la pregunta sigue siendo vendor, escenario o ficha tecnica, vuelve antes a la ruta LLM. Si el cuello de botella es serving local o coste de hardware, salta a Inference Hardware Guide.

Recetas vivas

6

Rutas accionables

Rutas de bajo coste

0

Buenas para workers o local-first

Rutas complejas

3

Piden mas control o tooling

Rutas local-first

1

Privacidad o self-host

Como leer esta board operativa

  1. 1

    Problema

    Empieza por la restriccion operativa

    Elige la receta por el cuello de botella real: coste de review, calidad de retrieval, input multimodal o control.

  2. 2

    Stack

    Separa lanes de workers de lanes de cierre

    Los flujos utiles suelen dividir workers baratos, planners fuertes y puertas de validacion reales.

  3. 3

    Validacion

    Mantiene visibles tests, checkpoints o evidencia grounded

    Un workflow sin validacion real es una demo, no una ruta operativa.

Ruta LLM

Vuelve a la capa de routing si todavia necesitas aclarar si el problema es vendor, modelo o escenario.

Agent stack board

Abre la capa de stack cuando la receta se bloquea por arquitectura, gobierno u orquestacion browser.

Model fit radar

Usa picks de modelo por escenario cuando la receta ya esta clara pero la lane de modelo todavia no.

Inference guide

Abre hardware cuando la receta ya esta limitada por serving local, VRAM, RAM o presupuesto energetico.

Coding review

Loop de revision de codigo con worker barato y cierre fuerte

Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.

Research

Research y sintesis con planner largo y salida ejecutiva

Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.

Retrieval

Retrieval mas tools para flujos con grounding real

Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.

Browser agents

Flow de navegador con agentes y cierres humanos

Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.

Multimodal

Analisis multimodal con una lane fuerte y salida compacta

Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.

Local-first

Workflow local-first para privacidad, edge y control

Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.

Board operativa

Recetas que responden que conviene ejecutar despues

Mapa practico de lanes
Receta Stack recomendado Modelo y proveedor Perfil de decision Cautela principal

Coding review

Loop de revision de codigo con worker barato y cierre fuerte

Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.

  • Worker economico para triage de diffs y smell detection
  • Planner fuerte para riesgos, regresiones y respuesta final
  • Tests y lint como puerta obligatoria antes del cierre

Modelo: GPT-5.4 mini para workers y GPT-5.4 para cierre o review final.

Proveedor: OpenAI encaja mejor cuando el loop depende de tooling, repo context y cierre fuerte.

Media Media Media
  • No dejes la respuesta final en manos del worker barato.
  • Si no hay tests, el loop produce falsa confianza muy rapido.

Research

Research y sintesis con planner largo y salida ejecutiva

Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.

  • Busqueda o captura de fuentes separada de la sintesis
  • Planner con contexto largo para consolidar hallazgos
  • Formato final en memo o tabla antes de publicar

Modelo: GPT-5.4 como planner principal y Gemini 2.5 Flash-Lite si necesitas una pasada barata de clasificacion.

Proveedor: OpenAI para razonamiento sostenido; Google como apoyo cuando importa throughput de lectura.

Media-alta Media Media
  • No uses una sola pasada para recoger fuentes y decidir.
  • Si pides demasiada prosa, la utilidad cae aunque el razonamiento sea bueno.

Retrieval

Retrieval mas tools para flujos con grounding real

Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.

  • Retriever o busqueda hibrida con filtros simples
  • Tool layer para acciones externas o consultas verificables
  • Modelo de sintesis separado del retrieval

Modelo: Gemini 2.5 Flash-Lite o GPT-5.4 mini para retrieval workers; GPT-5.4 para sintesis delicada.

Proveedor: Google y OpenAI funcionan bien si separas worker barato y capa final; la clave es el diseno del retrieval.

Media Media Alta
  • Mas contexto no arregla un retrieval mal planteado.
  • Si la tool layer no audita bien, el flujo parece seguro pero no lo es.

Browser agents

Flow de navegador con agentes y cierres humanos

Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.

  • Worker de browser para exploracion y captura
  • Planner separado para decidir el siguiente paso
  • Checkpoint humano o regla fuerte antes de acciones sensibles

Modelo: GPT-5.4 mini para workers de navegador y GPT-5.4 para planner o aprobador.

Proveedor: OpenAI encaja mejor cuando el flujo depende de tool use iterativo y salidas controladas.

Media Media-alta Alta
  • No confundas observacion con ejecucion automatica segura.
  • Las UIs inestables disparan coste y error si el flujo no esta acotado.

Multimodal

Analisis multimodal con una lane fuerte y salida compacta

Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.

  • Una lane multimodal fuerte para la lectura principal
  • Resumen textual corto y accionable como salida base
  • Ruta secundaria de verificacion si la pieza es critica

Modelo: Gemini 2.5 Pro como primera opcion; GPT-5.4 mini solo si el input visual es ligero.

Proveedor: Google conviene mas cuando el problema es multimodal de verdad y no solo texto con imagen decorativa.

Media-alta Media Media
  • No metas multimodalidad si el caso real es texto y tabla.
  • Sin una salida compacta, el usuario acaba con una descripcion bonita pero poco util.

Local-first

Workflow local-first para privacidad, edge y control

Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.

  • Modelo open-weight o self-host como lane primaria
  • Fallback remoto solo para casos premium o validacion final
  • Observabilidad simple sobre coste, latencia y calidad

Modelo: Mistral Large 3 o Ministral 3 8B segun calidad deseada y huella operativa.

Proveedor: Mistral encaja mejor cuando la estrategia open-weight o private cloud es una decision real, no un eslogan.

Competitiva Variable Alta
  • Local-first no significa local-only: reserva una salida para casos complejos.
  • Si no mides hardware y throughput, el argumento de coste se vuelve retorico.

Coding review

Loop de revision de codigo con worker barato y cierre fuerte

Media

Problema: Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.

Stack recomendado

  • Worker economico para triage de diffs y smell detection
  • Planner fuerte para riesgos, regresiones y respuesta final
  • Tests y lint como puerta obligatoria antes del cierre

Pasos del flujo

  1. Recorta el diff en bloques y pide a un worker barato riesgos, huecos de pruebas y archivos criticos.
  2. Pasa solo los hallazgos fuertes al planner o reviewer principal.
  3. Ejecuta pruebas reales antes de convertir el review en decision final.

Modelo: GPT-5.4 mini para workers y GPT-5.4 para cierre o review final.

Proveedor: OpenAI encaja mejor cuando el loop depende de tooling, repo context y cierre fuerte.

Media Media Media

Cautelas

  • No dejes la respuesta final en manos del worker barato.
  • Si no hay tests, el loop produce falsa confianza muy rapido.

Research

Research y sintesis con planner largo y salida ejecutiva

Media-alta

Problema: Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.

Stack recomendado

  • Busqueda o captura de fuentes separada de la sintesis
  • Planner con contexto largo para consolidar hallazgos
  • Formato final en memo o tabla antes de publicar

Pasos del flujo

  1. Separa captura de fuentes y sintesis para no mezclar evidencia con resumen demasiado pronto.
  2. Marca contradicciones y huecos antes de escribir la conclusion.
  3. Cierra con una salida ejecutiva corta y una lista de validaciones pendientes.

Modelo: GPT-5.4 como planner principal y Gemini 2.5 Flash-Lite si necesitas una pasada barata de clasificacion.

Proveedor: OpenAI para razonamiento sostenido; Google como apoyo cuando importa throughput de lectura.

Media-alta Media Media

Cautelas

  • No uses una sola pasada para recoger fuentes y decidir.
  • Si pides demasiada prosa, la utilidad cae aunque el razonamiento sea bueno.

Retrieval

Retrieval mas tools para flujos con grounding real

Media

Problema: Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.

Stack recomendado

  • Retriever o busqueda hibrida con filtros simples
  • Tool layer para acciones externas o consultas verificables
  • Modelo de sintesis separado del retrieval

Pasos del flujo

  1. Recupera pocos bloques buenos antes de ampliar el contexto.
  2. Usa tools para verificar o actuar y deja rastros claros de cada llamada.
  3. Pide una sintesis final que cite limites y lagunas del grounding.

Modelo: Gemini 2.5 Flash-Lite o GPT-5.4 mini para retrieval workers; GPT-5.4 para sintesis delicada.

Proveedor: Google y OpenAI funcionan bien si separas worker barato y capa final; la clave es el diseno del retrieval.

Media Media Alta

Cautelas

  • Mas contexto no arregla un retrieval mal planteado.
  • Si la tool layer no audita bien, el flujo parece seguro pero no lo es.

Browser agents

Flow de navegador con agentes y cierres humanos

Media

Problema: Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.

Stack recomendado

  • Worker de browser para exploracion y captura
  • Planner separado para decidir el siguiente paso
  • Checkpoint humano o regla fuerte antes de acciones sensibles

Pasos del flujo

  1. Explora la UI con pasos cortos y captura evidencia antes de actuar.
  2. Haz que el planner resuma estado, riesgos y siguiente accion.
  3. Bloquea submits o cambios destructivos detras de una aprobacion clara.

Modelo: GPT-5.4 mini para workers de navegador y GPT-5.4 para planner o aprobador.

Proveedor: OpenAI encaja mejor cuando el flujo depende de tool use iterativo y salidas controladas.

Media Media-alta Alta

Cautelas

  • No confundas observacion con ejecucion automatica segura.
  • Las UIs inestables disparan coste y error si el flujo no esta acotado.

Multimodal

Analisis multimodal con una lane fuerte y salida compacta

Media-alta

Problema: Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.

Stack recomendado

  • Una lane multimodal fuerte para la lectura principal
  • Resumen textual corto y accionable como salida base
  • Ruta secundaria de verificacion si la pieza es critica

Pasos del flujo

  1. Define primero que senales importan y que salida accionable necesitas.
  2. Procesa el activo multimodal en una sola lane fuerte antes de resumir.
  3. Baja a formato memo, checklist o scorecard para que la decision sea util.

Modelo: Gemini 2.5 Pro como primera opcion; GPT-5.4 mini solo si el input visual es ligero.

Proveedor: Google conviene mas cuando el problema es multimodal de verdad y no solo texto con imagen decorativa.

Media-alta Media Media

Cautelas

  • No metas multimodalidad si el caso real es texto y tabla.
  • Sin una salida compacta, el usuario acaba con una descripcion bonita pero poco util.

Local-first

Workflow local-first para privacidad, edge y control

Competitiva

Problema: Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.

Stack recomendado

  • Modelo open-weight o self-host como lane primaria
  • Fallback remoto solo para casos premium o validacion final
  • Observabilidad simple sobre coste, latencia y calidad

Pasos del flujo

  1. Define que tareas deben quedarse locales y cuales pueden escalar a remoto.
  2. Dimensiona la lane local para el caso base, no para el benchmark mas extremo.
  3. Mide latencia, calidad y coste antes de activar un fallback frontier.

Modelo: Mistral Large 3 o Ministral 3 8B segun calidad deseada y huella operativa.

Proveedor: Mistral encaja mejor cuando la estrategia open-weight o private cloud es una decision real, no un eslogan.

Competitiva Variable Alta

Cautelas

  • Local-first no significa local-only: reserva una salida para casos complejos.
  • Si no mides hardware y throughput, el argumento de coste se vuelve retorico.