Radar de modelos

Elige la lane de modelo correcta para la tarea antes de que el stack se endurezca alrededor del default equivocado.

Model Fit Radar es la capa rapida de decision por encima de la matrix. Responde con que lane conviene empezar para coding, reasoning largo, multimodal, estrategia local-open, routing barato y workers de agentes.

ℹ️

Reglas del snapshot

Model Fit Radar es la capa de escenario. Usa un snapshot local 2026-03 apoyado en la misma base con fuentes oficiales que la AI matrix. Usalo cuando la pregunta vendor ya esta bastante cerrada y todavia no necesitas una receta operativa. Si el encaje local-open ya depende de limites de serving, salta a Inference Hardware Guide.

Escenarios cubiertos

Picks orientados a decision

Rutas premium

Frontier o final pass

Rutas baratas

Buenas para routing o workers

Rutas local-open

Self-host o estrategia open-weight

Radar vs matrix

Usa el radar cuando la pregunta es encaje por tarea y no forma tecnica del modelo

La matrix sigue siendo tecnica. El radar existe para responder por que lane empezar segun el escenario operativo.

Escalado

No fuerces un solo modelo para cubrir todas las lanes

Un worker barato mas una ultima pasada fuerte suele ganar en coste y control frente a una lane universal.

Separacion

Mantiene separadas las rutas multimodal, local-open y coding

El peor default suele aparecer cuando todas las opciones se aplastan en una lista vaga de "mejor modelo".

Radar de decision

Picks de modelo orientados a escenario

Snapshot con docs oficiales

Escenario	Pick principal	Usalo cuando	Coste y latencia	Evitalo cuando
Coding GPT-5.4 encaja mejor cuando el trabajo combina codigo, tools y loops largos de agente con repo real.	GPT-5.4 Runner-up: Claude Sonnet 4 Si el flujo es puro coding y sensible a coste, conviene dejar un fallback especialista o una lane mini.	Usalo para refactors acotados, PRs grandes, debugging guiado por herramientas y tareas donde importa una ultima pasada fuerte.	Premium Media	No es la mejor primera opcion para autocomplete barato, triage masivo o workers simples. Fuente oficial: OpenAI GPT-5.4
Reasoning largo La mejor primera opcion cuando importan contexto largo, planificacion y continuidad entre herramientas.	GPT-5.4 Runner-up: Claude Sonnet 4 Si el reasoning ocurre dentro de un workflow mas grande, conviene reservar esta lane para planner o final pass.	Usalo para analisis de docs largos, decisiones tecnicas, research exigente y planes con multiples restricciones.	Media-alta Media	No compensa para clasificacion barata, borradores cortos o jobs donde prima throughput. Fuente oficial: OpenAI GPT-5.4
Coste y throughput Encaja mejor cuando el objetivo es bajar coste por tarea sin romper del todo modalidad ni contexto.	Gemini 2.5 Flash-Lite Runner-up: DeepSeek V3.2 La mejor lectura operativa es usarlo como worker barato antes de escalar a una lane mas fuerte.	Usalo para routing, clasificacion, borradores, ranking, filtros y primeras pasadas de alto volumen.	Baja Baja	No deberia cargar con la ultima decision en reasoning delicado, governance o debugging dificil. Fuente oficial: Gemini pricing
Multimodal La mejor opcion cuando entran audio, video, imagen y documentos largos en la misma decision.	Gemini 2.5 Pro Runner-up: GPT-5.4 mini Si el caso de uso se vuelve solo texto, conviene bajar a una lane mas barata o mas especializada.	Usalo para analisis multimodal serio, documentos pesados, activos visuales y entradas heterogeneas.	Media-alta Media	No es la primera eleccion para texto barato o tareas donde la multimodalidad no aporta valor real. Fuente oficial: Gemini model docs
Local y open Es la lane mas util cuando la arquitectura pide self-host, private cloud o una estrategia open-weight real.	Mistral Large 3 Runner-up: Ministral 3 8B Cuando el tamano importa mas que la calidad maxima, conviene bajar a la lane edge de Ministral.	Usalo para privacidad, residencia regional, routers propios y stacks donde el hosting forma parte del producto.	Competitiva Media	No es la mejor apuesta si el equipo depende del ecosistema mas grande o del frontier absoluto en coding. Fuente oficial: Mistral model overview
Agents y subagents Es la mejor lane cuando necesitas workers baratos, rapidos y competentes antes de escalar a un aprobador fuerte.	GPT-5.4 mini Runner-up: GPT-5.4 La lectura operativa correcta es mini para workers y GPT-5.4 para planner, revisor o cierre.	Usalo para subagents, decomposition, tool loops, browser workers y tareas repetibles con control de gasto.	Media Media-baja	No conviene dejarle en solitario la ultima respuesta si el trabajo exige reasoning frontier sostenido. Fuente oficial: OpenAI GPT-5.4 mini

Coding

GPT-5.4

Premium

Por que: GPT-5.4 encaja mejor cuando el trabajo combina codigo, tools y loops largos de agente con repo real.

Usalo cuando: Usalo para refactors acotados, PRs grandes, debugging guiado por herramientas y tareas donde importa una ultima pasada fuerte.

Runner-up: Claude Sonnet 4

Nota operativa: Si el flujo es puro coding y sensible a coste, conviene dejar un fallback especialista o una lane mini.

Evitalo cuando: No es la mejor primera opcion para autocomplete barato, triage masivo o workers simples.

Premium Media

Fuente oficial

Reasoning largo

GPT-5.4

Media-alta

Por que: La mejor primera opcion cuando importan contexto largo, planificacion y continuidad entre herramientas.

Usalo cuando: Usalo para analisis de docs largos, decisiones tecnicas, research exigente y planes con multiples restricciones.

Runner-up: Claude Sonnet 4

Nota operativa: Si el reasoning ocurre dentro de un workflow mas grande, conviene reservar esta lane para planner o final pass.

Evitalo cuando: No compensa para clasificacion barata, borradores cortos o jobs donde prima throughput.

Media-alta Media

Fuente oficial

Coste y throughput

Gemini 2.5 Flash-Lite

Baja

Por que: Encaja mejor cuando el objetivo es bajar coste por tarea sin romper del todo modalidad ni contexto.

Usalo cuando: Usalo para routing, clasificacion, borradores, ranking, filtros y primeras pasadas de alto volumen.

Runner-up: DeepSeek V3.2

Nota operativa: La mejor lectura operativa es usarlo como worker barato antes de escalar a una lane mas fuerte.

Evitalo cuando: No deberia cargar con la ultima decision en reasoning delicado, governance o debugging dificil.

Baja Baja

Fuente oficial

Multimodal

Gemini 2.5 Pro

Media-alta

Por que: La mejor opcion cuando entran audio, video, imagen y documentos largos en la misma decision.

Usalo cuando: Usalo para analisis multimodal serio, documentos pesados, activos visuales y entradas heterogeneas.

Runner-up: GPT-5.4 mini

Nota operativa: Si el caso de uso se vuelve solo texto, conviene bajar a una lane mas barata o mas especializada.

Evitalo cuando: No es la primera eleccion para texto barato o tareas donde la multimodalidad no aporta valor real.

Media-alta Media

Fuente oficial

Local y open

Mistral Large 3

Competitiva

Por que: Es la lane mas util cuando la arquitectura pide self-host, private cloud o una estrategia open-weight real.

Usalo cuando: Usalo para privacidad, residencia regional, routers propios y stacks donde el hosting forma parte del producto.

Runner-up: Ministral 3 8B

Nota operativa: Cuando el tamano importa mas que la calidad maxima, conviene bajar a la lane edge de Ministral.

Evitalo cuando: No es la mejor apuesta si el equipo depende del ecosistema mas grande o del frontier absoluto en coding.

Competitiva Media

Fuente oficial

Agents y subagents

GPT-5.4 mini

Media

Por que: Es la mejor lane cuando necesitas workers baratos, rapidos y competentes antes de escalar a un aprobador fuerte.

Usalo cuando: Usalo para subagents, decomposition, tool loops, browser workers y tareas repetibles con control de gasto.

Runner-up: GPT-5.4

Nota operativa: La lectura operativa correcta es mini para workers y GPT-5.4 para planner, revisor o cierre.

Evitalo cuando: No conviene dejarle en solitario la ultima respuesta si el trabajo exige reasoning frontier sostenido.

Media Media-baja

Fuente oficial

Ruta LLM

Empieza por la capa de routing si todavia decides entre vendor, matrix o workflow.

Abrir ruta LLM

Provider compare

Define primero la lane de proveedor antes de cerrar la lane de modelo.

Abrir proveedores

LLM Matrix

Vuelve a la comparativa tecnica cuando importan mas contexto, precio o despliegue que el escenario.

Abrir matrix

Workflow recipes

Salta a recetas operativas cuando la lane de modelo ya esta elegida.

Abrir recetas

Inference guide

Abre la guia de hardware cuando la eleccion local-open o multimodal ya depende de VRAM, RAM o consumo.

Abrir hardware