Ruta LLM
Vuelve a la capa de routing si todavia necesitas aclarar si el problema es vendor, modelo o escenario.
Esta pagina convierte problemas repetidos en patrones operativos acotados para coding review, research, retrieval, browser agents, analisis multimodal y despliegue local-first.
Reglas del snapshot local
Recetas vivas
Rutas accionables
Rutas de bajo coste
Buenas para workers o local-first
Rutas complejas
Piden mas control o tooling
Rutas local-first
Privacidad o self-host
Problema
Elige la receta por el cuello de botella real: coste de review, calidad de retrieval, input multimodal o control.
Stack
Los flujos utiles suelen dividir workers baratos, planners fuertes y puertas de validacion reales.
Validacion
Un workflow sin validacion real es una demo, no una ruta operativa.
Vuelve a la capa de routing si todavia necesitas aclarar si el problema es vendor, modelo o escenario.
Abre la capa de stack cuando la receta se bloquea por arquitectura, gobierno u orquestacion browser.
Usa picks de modelo por escenario cuando la receta ya esta clara pero la lane de modelo todavia no.
Abre hardware cuando la receta ya esta limitada por serving local, VRAM, RAM o presupuesto energetico.
Busca recetas por problema, stack o lane de modelo
Busca por tema o categoria.
6 resultados visibles
Coding review
Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.
Research
Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.
Retrieval
Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.
Browser agents
Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.
Multimodal
Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.
Local-first
Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.
| Receta | Stack recomendado | Modelo y proveedor | Perfil de decision | Cautela principal |
|---|---|---|---|---|
| Coding review Loop de revision de codigo con worker barato y cierre fuerteCuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia. |
| Modelo: GPT-5.4 mini para workers y GPT-5.4 para cierre o review final. Proveedor: OpenAI encaja mejor cuando el loop depende de tooling, repo context y cierre fuerte. | Media Media Media |
|
| Research Research y sintesis con planner largo y salida ejecutivaCuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util. |
| Modelo: GPT-5.4 como planner principal y Gemini 2.5 Flash-Lite si necesitas una pasada barata de clasificacion. Proveedor: OpenAI para razonamiento sostenido; Google como apoyo cuando importa throughput de lectura. | Media-alta Media Media |
|
| Retrieval Retrieval mas tools para flujos con grounding realCuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno. |
| Modelo: Gemini 2.5 Flash-Lite o GPT-5.4 mini para retrieval workers; GPT-5.4 para sintesis delicada. Proveedor: Google y OpenAI funcionan bien si separas worker barato y capa final; la clave es el diseno del retrieval. | Media Media Alta |
|
| Browser agents Flow de navegador con agentes y cierres humanosCuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control. |
| Modelo: GPT-5.4 mini para workers de navegador y GPT-5.4 para planner o aprobador. Proveedor: OpenAI encaja mejor cuando el flujo depende de tool use iterativo y salidas controladas. | Media Media-alta Alta |
|
| Multimodal Analisis multimodal con una lane fuerte y salida compactaCuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util. |
| Modelo: Gemini 2.5 Pro como primera opcion; GPT-5.4 mini solo si el input visual es ligero. Proveedor: Google conviene mas cuando el problema es multimodal de verdad y no solo texto con imagen decorativa. | Media-alta Media Media |
|
| Local-first Workflow local-first para privacidad, edge y controlCuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality. |
| Modelo: Mistral Large 3 o Ministral 3 8B segun calidad deseada y huella operativa. Proveedor: Mistral encaja mejor cuando la estrategia open-weight o private cloud es una decision real, no un eslogan. | Competitiva Variable Alta |
|
Coding review
Problema: Cuando hay que revisar PRs o diffs reales sin pagar una lane frontier en cada pasada intermedia.
Stack recomendado
Pasos del flujo
Modelo: GPT-5.4 mini para workers y GPT-5.4 para cierre o review final.
Proveedor: OpenAI encaja mejor cuando el loop depende de tooling, repo context y cierre fuerte.
Cautelas
Research
Problema: Cuando la tarea mezcla varias fuentes, contradicciones y una conclusion que debe quedar compacta y util.
Stack recomendado
Pasos del flujo
Modelo: GPT-5.4 como planner principal y Gemini 2.5 Flash-Lite si necesitas una pasada barata de clasificacion.
Proveedor: OpenAI para razonamiento sostenido; Google como apoyo cuando importa throughput de lectura.
Cautelas
Retrieval
Problema: Cuando el modelo debe operar con documentos o sistemas externos y no basta con conocimiento interno.
Stack recomendado
Pasos del flujo
Modelo: Gemini 2.5 Flash-Lite o GPT-5.4 mini para retrieval workers; GPT-5.4 para sintesis delicada.
Proveedor: Google y OpenAI funcionan bien si separas worker barato y capa final; la clave es el diseno del retrieval.
Cautelas
Browser agents
Problema: Cuando la tarea exige navegar UIs reales, extraer estado y cerrar acciones con cierto control.
Stack recomendado
Pasos del flujo
Modelo: GPT-5.4 mini para workers de navegador y GPT-5.4 para planner o aprobador.
Proveedor: OpenAI encaja mejor cuando el flujo depende de tool use iterativo y salidas controladas.
Cautelas
Multimodal
Problema: Cuando entran imagen, audio, video o PDF largo y la decision debe salir en una sola lectura util.
Stack recomendado
Pasos del flujo
Modelo: Gemini 2.5 Pro como primera opcion; GPT-5.4 mini solo si el input visual es ligero.
Proveedor: Google conviene mas cuando el problema es multimodal de verdad y no solo texto con imagen decorativa.
Cautelas
Local-first
Problema: Cuando residencia, coste fijo o autonomia del stack pesan mas que el ultimo punto de frontier quality.
Stack recomendado
Pasos del flujo
Modelo: Mistral Large 3 o Ministral 3 8B segun calidad deseada y huella operativa.
Proveedor: Mistral encaja mejor cuando la estrategia open-weight o private cloud es una decision real, no un eslogan.
Cautelas