Radar vs matrix
Usa el radar cuando la pregunta es encaje por tarea y no forma tecnica del modelo
La matrix sigue siendo tecnica. El radar existe para responder por que lane empezar segun el escenario operativo.
Model Fit Radar es la capa rapida de decision por encima de la matrix. Responde con que lane conviene empezar para coding, reasoning largo, multimodal, estrategia local-open, routing barato y workers de agentes.
Reglas del snapshot
Escenarios cubiertos
Picks orientados a decision
Rutas premium
Frontier o final pass
Rutas baratas
Buenas para routing o workers
Rutas local-open
Self-host o estrategia open-weight
Radar vs matrix
La matrix sigue siendo tecnica. El radar existe para responder por que lane empezar segun el escenario operativo.
Escalado
Un worker barato mas una ultima pasada fuerte suele ganar en coste y control frente a una lane universal.
Separacion
El peor default suele aparecer cuando todas las opciones se aplastan en una lista vaga de "mejor modelo".
| Escenario | Pick principal | Usalo cuando | Coste y latencia | Evitalo cuando |
|---|---|---|---|---|
| Coding GPT-5.4 encaja mejor cuando el trabajo combina codigo, tools y loops largos de agente con repo real. | GPT-5.4 Runner-up: Claude Sonnet 4 Si el flujo es puro coding y sensible a coste, conviene dejar un fallback especialista o una lane mini. | Usalo para refactors acotados, PRs grandes, debugging guiado por herramientas y tareas donde importa una ultima pasada fuerte. | Premium Media | No es la mejor primera opcion para autocomplete barato, triage masivo o workers simples. Fuente oficial: OpenAI GPT-5.4 |
| Reasoning largo La mejor primera opcion cuando importan contexto largo, planificacion y continuidad entre herramientas. | GPT-5.4 Runner-up: Claude Sonnet 4 Si el reasoning ocurre dentro de un workflow mas grande, conviene reservar esta lane para planner o final pass. | Usalo para analisis de docs largos, decisiones tecnicas, research exigente y planes con multiples restricciones. | Media-alta Media | No compensa para clasificacion barata, borradores cortos o jobs donde prima throughput. Fuente oficial: OpenAI GPT-5.4 |
| Coste y throughput Encaja mejor cuando el objetivo es bajar coste por tarea sin romper del todo modalidad ni contexto. | Gemini 2.5 Flash-Lite Runner-up: DeepSeek V3.2 La mejor lectura operativa es usarlo como worker barato antes de escalar a una lane mas fuerte. | Usalo para routing, clasificacion, borradores, ranking, filtros y primeras pasadas de alto volumen. | Baja Baja | No deberia cargar con la ultima decision en reasoning delicado, governance o debugging dificil. Fuente oficial: Gemini pricing |
| Multimodal La mejor opcion cuando entran audio, video, imagen y documentos largos en la misma decision. | Gemini 2.5 Pro Runner-up: GPT-5.4 mini Si el caso de uso se vuelve solo texto, conviene bajar a una lane mas barata o mas especializada. | Usalo para analisis multimodal serio, documentos pesados, activos visuales y entradas heterogeneas. | Media-alta Media | No es la primera eleccion para texto barato o tareas donde la multimodalidad no aporta valor real. Fuente oficial: Gemini model docs |
| Local y open Es la lane mas util cuando la arquitectura pide self-host, private cloud o una estrategia open-weight real. | Mistral Large 3 Runner-up: Ministral 3 8B Cuando el tamano importa mas que la calidad maxima, conviene bajar a la lane edge de Ministral. | Usalo para privacidad, residencia regional, routers propios y stacks donde el hosting forma parte del producto. | Competitiva Media | No es la mejor apuesta si el equipo depende del ecosistema mas grande o del frontier absoluto en coding. Fuente oficial: Mistral model overview |
| Agents y subagents Es la mejor lane cuando necesitas workers baratos, rapidos y competentes antes de escalar a un aprobador fuerte. | GPT-5.4 mini Runner-up: GPT-5.4 La lectura operativa correcta es mini para workers y GPT-5.4 para planner, revisor o cierre. | Usalo para subagents, decomposition, tool loops, browser workers y tareas repetibles con control de gasto. | Media Media-baja | No conviene dejarle en solitario la ultima respuesta si el trabajo exige reasoning frontier sostenido. Fuente oficial: OpenAI GPT-5.4 mini |
Coding
Por que: GPT-5.4 encaja mejor cuando el trabajo combina codigo, tools y loops largos de agente con repo real.
Usalo cuando: Usalo para refactors acotados, PRs grandes, debugging guiado por herramientas y tareas donde importa una ultima pasada fuerte.
Runner-up: Claude Sonnet 4
Nota operativa: Si el flujo es puro coding y sensible a coste, conviene dejar un fallback especialista o una lane mini.
Evitalo cuando: No es la mejor primera opcion para autocomplete barato, triage masivo o workers simples.
Reasoning largo
Por que: La mejor primera opcion cuando importan contexto largo, planificacion y continuidad entre herramientas.
Usalo cuando: Usalo para analisis de docs largos, decisiones tecnicas, research exigente y planes con multiples restricciones.
Runner-up: Claude Sonnet 4
Nota operativa: Si el reasoning ocurre dentro de un workflow mas grande, conviene reservar esta lane para planner o final pass.
Evitalo cuando: No compensa para clasificacion barata, borradores cortos o jobs donde prima throughput.
Coste y throughput
Por que: Encaja mejor cuando el objetivo es bajar coste por tarea sin romper del todo modalidad ni contexto.
Usalo cuando: Usalo para routing, clasificacion, borradores, ranking, filtros y primeras pasadas de alto volumen.
Runner-up: DeepSeek V3.2
Nota operativa: La mejor lectura operativa es usarlo como worker barato antes de escalar a una lane mas fuerte.
Evitalo cuando: No deberia cargar con la ultima decision en reasoning delicado, governance o debugging dificil.
Multimodal
Por que: La mejor opcion cuando entran audio, video, imagen y documentos largos en la misma decision.
Usalo cuando: Usalo para analisis multimodal serio, documentos pesados, activos visuales y entradas heterogeneas.
Runner-up: GPT-5.4 mini
Nota operativa: Si el caso de uso se vuelve solo texto, conviene bajar a una lane mas barata o mas especializada.
Evitalo cuando: No es la primera eleccion para texto barato o tareas donde la multimodalidad no aporta valor real.
Local y open
Por que: Es la lane mas util cuando la arquitectura pide self-host, private cloud o una estrategia open-weight real.
Usalo cuando: Usalo para privacidad, residencia regional, routers propios y stacks donde el hosting forma parte del producto.
Runner-up: Ministral 3 8B
Nota operativa: Cuando el tamano importa mas que la calidad maxima, conviene bajar a la lane edge de Ministral.
Evitalo cuando: No es la mejor apuesta si el equipo depende del ecosistema mas grande o del frontier absoluto en coding.
Agents y subagents
Por que: Es la mejor lane cuando necesitas workers baratos, rapidos y competentes antes de escalar a un aprobador fuerte.
Usalo cuando: Usalo para subagents, decomposition, tool loops, browser workers y tareas repetibles con control de gasto.
Runner-up: GPT-5.4
Nota operativa: La lectura operativa correcta es mini para workers y GPT-5.4 para planner, revisor o cierre.
Evitalo cuando: No conviene dejarle en solitario la ultima respuesta si el trabajo exige reasoning frontier sostenido.
Empieza por la capa de routing si todavia decides entre vendor, matrix o workflow.
Define primero la lane de proveedor antes de cerrar la lane de modelo.
Vuelve a la comparativa tecnica cuando importan mas contexto, precio o despliegue que el escenario.
Salta a recetas operativas cuando la lane de modelo ya esta elegida.
Abre la guia de hardware cuando la eleccion local-open o multimodal ya depende de VRAM, RAM o consumo.