OpenAI lanza GPT-5.5: más potente, más autónomo y el doble de caro en la API

El primer modelo completamente reentrenado desde GPT-4.5 lidera benchmarks de código y agentes — pero su precio duplica al de GPT-5.4 y Claude Opus 4.7 le gana donde más importa para muchos equipos.

OpenAI presentó el 23 de abril de 2026 GPT-5.5, el que describe como el modelo de IA más potente que ha construido y el primero completamente reentrenado desde GPT-4.5. El lanzamiento llega exactamente una semana después de que Anthropic publicara Claude Opus 4.7 y recuperara la cima de los benchmarks de programación — y la respuesta de OpenAI es agresiva: un modelo nuevo, con capacidades agenticas significativamente mejoradas, disponible desde hoy para suscriptores Plus, Pro, Business y Enterprise en ChatGPT y Codex.

La noticia tiene dos caras. En capacidad técnica, GPT-5.5 hace cosas que ningún modelo de disponibilidad general hacía antes — especialmente en flujos de trabajo autónomos de múltiples pasos. En precio, la API cuesta el doble que GPT-5.4. Y hay áreas donde Claude Opus 4.7 sigue siendo la mejor opción. Esto es lo que sabemos.

82.7% Terminal-Bench 2.0 — líder absoluto de modelos públicos

2× Precio API vs GPT-5.4 ($5/$30 vs $2.50/$15 por 1M tokens)

400K Tokens de contexto en Codex — ventana de trabajo

20h Tiempo humano estimado en tareas Expert-SWE que GPT-5.5 supera

Qué es GPT-5.5 y qué lo hace diferente

GPT-5.5, cuyo nombre en clave interno es “Spud”, no es una actualización incremental de GPT-5.4. Es el primer modelo de base completamente reentrenado de OpenAI en más de un año — lo que significa que no hereda los pesos del modelo anterior, sino que fue construido desde cero con nuevos objetivos de entrenamiento.

El enfoque central es la agenticidad: la capacidad de completar tareas complejas de múltiples pasos de manera autónoma, sin que el usuario tenga que dar instrucciones o aprobación en cada fase. OpenAI lo describe como un modelo que “entiende lo que intentas hacer más rápido y puede asumir más trabajo por sí mismo”.

En la práctica, eso significa que GPT-5.5 puede recibir una tarea desordenada y ambigua — rediseña este sistema de comentarios, analiza esta base de código, genera este informe de negocio — y planificar los pasos necesarios, usar herramientas, revisar su propio trabajo y avanzar hasta completarla. Uno de los ingenieros que lo probó en acceso anticipado describe cómo pidió al modelo que rediseñara un sistema de comentarios en un editor colaborativo de Markdown y regresó para encontrar una serie de 12 diferencias casi completa.

GPT-5.5 no busca responder mejor tus preguntas. Busca terminar tu trabajo por ti — y los benchmarks sugieren que, en ciertos tipos de trabajo, ya puede hacerlo.

Los benchmarks: dónde gana y dónde no

OpenAI publicó una tabla de comparación contra sus rivales directos al momento del lanzamiento. A diferencia de muchos anuncios de modelos, incluyeron benchmarks donde van por detrás — una señal de confianza real o, al menos, de transparencia táctica. Estos son los números verificados:

Benchmark	GPT-5.5	GPT-5.4	Claude Opus 4.7	Gemini 3.1 Pro
Terminal-Bench 2.0 (agentes CLI)	82.7% ★	75.1%	69.4%	68.5%
SWE-Bench Pro (código real GitHub)	58.6%	—	64.3% ★	—
GDPval (44 ocupaciones reales)	84.9% ★	83.0%	80.3%	~80%
OSWorld-Verified (computadora real)	78.7% ★	75.0%	—	—
FrontierMath Tier 4 (matemáticas)	35.4% ★	—	22.9%	16.7%
MCP Atlas (uso de herramientas)	75.3%	—	79.1% ★	78.2%
BrowseComp (búsqueda web)	84.4%	—	—	85.9% ★
MRCR v2 1M tokens (contexto largo)	74.0% ★	36.6%	—	—
GPQA Diamond (razonamiento)	Competitivo	—	91.3%	94.3% ★

★ = líder en ese benchmark · Fuente: OpenAI launch page, LLM Stats, BenchLM, VentureBeat (23 abril 2026). Números son reportados por los propios proveedores salvo indicación.

Lo que revelan los números

Terminal-Bench 2.0 es la victoria más decisiva de GPT-5.5. Este benchmark evalúa flujos de trabajo reales en línea de comandos — planificación, iteración, coordinación de herramientas en entorno terminal — y GPT-5.5 supera a Claude Opus 4.7 por más de 13 puntos. Para desarrolladores que construyen agentes autónomos, runners de pipelines o automatización DevOps, este número importa más que SWE-bench.

SWE-Bench Pro es donde Claude Opus 4.7 mantiene ventaja real: 64.3% frente a 58.6% de GPT-5.5. Este benchmark mide resolución de problemas reales en repositorios de GitHub con múltiples archivos — el tipo de tarea de programación más cercana al trabajo cotidiano de un equipo de ingeniería. OpenAI argumenta que el resultado de Anthropic puede estar inflado por memorización en un subconjunto de problemas, pero la diferencia es suficientemente grande como para que no sea solo ruido.

MCP Atlas, el benchmark de uso de herramientas de Scale AI, también va a favor de Claude Opus 4.7 (79.1% vs 75.3%). Si tu caso de uso involucra modelos que coordinan múltiples herramientas externas — que es exactamente el escenario de agentes empresariales más común — Claude sigue siendo la mejor opción medible.

El salto más subestimado en la cobertura: MRCR v2 en contexto de 1 millón de tokens. GPT-5.5 pasa de 36.6% a 74.0% — más que duplicando la capacidad de GPT-5.4 para encontrar información relevante en contextos muy largos. Para equipos que trabajan con bases de código grandes, documentos legales extensos o repositorios de investigación, esto es un avance real.

El precio de GPT 5.5: el doble, con justificación parcial

Este es el dato que más debate ha generado desde el lanzamiento. Los precios de API de GPT-5.5 son:

Modelo	Input / 1M tokens	Output / 1M tokens	Nota
GPT-5.5 (estándar)	$5.00 USD	$30.00 USD	El doble que GPT-5.4. API disponible “muy pronto”. Incluido en Plus, Pro, Business, Enterprise.
GPT-5.5 Pro	$30.00 USD	$180.00 USD	Solo planes Pro, Business y Enterprise. Para tareas de máxima precisión.
GPT-5.4 (anterior)	$2.50 USD	$15.00 USD	Referencia. Sigue disponible en planes activos.
Claude Opus 4.7	$5.00 USD	$25.00 USD	Rival directo de GPT-5.5 estándar. Gana en SWE-bench Pro y uso de herramientas.
Gemini 3.1 Pro	$2.00 USD	$12.00 USD	La opción más económica del nivel de frontera. Gana en razonamiento y contexto 2M tokens.

El input pasa de $2.50 a $5.00 por millón de tokens — el doble. El output pasa de $15.00 a $30.00 — también el doble. GPT-5.5 Pro, disponible en planes de pago, llega a $30/$180 por millón de tokens, que es territorio de uso empresarial intensivo.

La defensa de OpenAI tiene algo de sustancia. GPT-5.5 usa significativamente menos tokens que GPT-5.4 para llegar a los mismos resultados en tareas de Codex. Si el modelo termina trabajos en menos pasos, el costo efectivo por tarea puede ser similar o incluso menor aunque el precio por token sea mayor. OpenAI habla de un incremento de costo efectivo de alrededor del 20% una vez contabilizada la eficiencia de tokens.

El argumento de OpenAI es: pagas el doble por token, pero usas 40% menos tokens. En cálculo de costo por tarea completada, el incremento real es aproximadamente del 20%, no del 100%.

El problema con ese argumento es que depende de la tarea. En tareas agenticas largas donde GPT-5.5 es más eficiente, la matemática funciona. En tareas conversacionales simples o de análisis de documentos, la eficiencia de tokens es menor y el aumento de precio se traslada directamente al costo.

Para equipos que evalúan si migrar de GPT-5.4 a GPT-5.5: a 10 millones de tokens de output al mes, GPT-5.5 estándar cuesta $300, mientras que Claude Opus 4.7 cuesta $250. Si GPT-5.5 completa las tareas en un 25% menos de pasos, el costo se equilibra. Si no, Claude es más barato en el nivel de potencia equivalente.

Disponibilidad de GPT 5.5: quién tiene acceso y desde cuándo

GPT-5.5 está disponible desde el 23 de abril de 2026 en ChatGPT y Codex para todos los suscriptores de los planes Plus, Pro, Business y Enterprise. No hay lista de espera — el acceso es inmediato para cuentas activas de pago.

GPT-5.5 Pro está disponible para los planes Pro, Business y Enterprise en ChatGPT. Es una versión del modelo orientada a tareas de mayor complejidad y precisión, con mejores resultados en razonamiento y análisis de datos, según OpenAI.

En Codex, GPT-5.5 ofrece una ventana de contexto de 400,000 tokens y un modo Fast que genera tokens 1.5 veces más rápido — aunque a 2.5 veces el costo estándar. El acceso por API está anunciado como “muy pronto” al momento de publicar este artículo.

Los usuarios del plan gratuito no tienen acceso a GPT-5.5. ChatGPT Free sigue usando GPT-5.4 como modelo principal.

El dato de seguridad que OpenAI no puede ignorar

OpenAI clasificó las capacidades de ciberseguridad de GPT-5.5 como “Alta” dentro de su Marco de Preparación — el mismo nivel que sus capacidades biológicas y químicas. El modelo puede encontrar y explotar vulnerabilidades de manera más eficaz que GPT-5.4.

No llegó al nivel “Crítico” en las evaluaciones, lo que habría bloqueado su lanzamiento bajo las propias políticas de OpenAI. Para compensar la clasificación Alta, la compañía desplegó clasificadores más estrictos para detectar usos de riesgo en ciberseguridad. Eso puede traducirse en rechazos de solicitudes legítimas de investigadores de seguridad mientras se afina la calibración — un problema que OpenAI reconoce directamente.

El modelo pasó por pruebas con expertos externos en ciberseguridad y biología antes del lanzamiento. OpenAI publicó una System Card de 44 páginas con los detalles completos de las evaluaciones de seguridad.

Qué significa para quienes usan IA en su trabajo

Si desarrollas software o construyes agentes

GPT-5.5 es la mejor opción pública para flujos de trabajo agenticos en terminal, DevOps y automatización de sistemas. La ventaja en Terminal-Bench 2.0 es real y documentada. Si tu caso de uso principal es código en múltiples archivos o resolución de problemas reales en repositorios GitHub, Claude Opus 4.7 todavía tiene ventaja medible en SWE-bench Pro.

Si usas IA para análisis, investigación o trabajo de conocimiento

La mejora en GDPval (84.9%) es real pero marginal respecto a GPT-5.4. Para trabajo de conocimiento cotidiano — redacción, análisis de documentos, investigación, creación de presentaciones — la diferencia entre GPT-5.5 y GPT-5.4 será menor de lo que los titulares sugieren. El coste extra puede no justificarse para estos casos de uso.

Si evalúas el costo de la API para un producto

La eficiencia de tokens compensa parte del aumento de precio en tareas agenticas, pero no en tareas simples. Claude Opus 4.7 al mismo precio base ($5/$25 vs $5/$30) puede ser más barato en output. Gemini 3.1 Pro a $2/$12 sigue siendo la opción de frontera más económica. La decisión debe hacerse con datos de tu carga de trabajo real, no con los benchmarks de OpenAI.

Postura Ellipsis Mx
GPT-5.5 es el modelo de OpenAI más capaz que existe y recupera el liderazgo en agentes autónomos y flujos de trabajo en terminal. El salto es real, no de marketing. Pero el precio duplicado en API y la ventaja que mantiene Claude Opus 4.7 en SWE-bench Pro y uso de herramientas hace que no sea automáticamente la mejor opción para todos. Para agentes autónomos y DevOps: GPT-5.5. Para código preciso en repositorios complejos: Claude Opus 4.7. Para presupuesto ajustado en API: Gemini 3.1 Pro.

El contexto que rodea el lanzamiento de GPT 5.5

El timing no es casual. Anthropic publicó Claude Opus 4.7 el 16 de abril y recuperó varios benchmarks de programación. OpenAI respondió exactamente una semana después con GPT-5.5. La guerra de modelos de IA en 2026 se está peleando semana a semana.

Hay otro contexto relevante: el lanzamiento de GPT-5.5 ocurre días antes del inicio del juicio entre Elon Musk y los directivos de OpenAI Sam Altman y Greg Brockman en un juzgado federal en Oakland, California. OpenAI llega a ese juicio con su modelo más potente hasta la fecha en el mercado. La visibilidad del lanzamiento tiene valor estratégico más allá de lo técnico.

Y finalmente: los “agentes del espacio de trabajo” que OpenAI anunció el 22 de abril — un día antes del lanzamiento de GPT-5.5 — apuntan a que la empresa está construyendo algo más grande que un chatbot mejorado. GPT-5.5 es el motor. La superapp de productividad que OpenAI quiere construir encima de él es el destino al que apuntan todos estos movimientos.

Fuentes
OpenAI, «Introducing GPT-5.5» (23 abril 2026) — openai.com/index/introducing-gpt-5-5 · OpenAI System Card GPT-5.5 (44 pp.) · Hipertextual, análisis de lanzamiento (23 abril 2026) · Xataka México, análisis de precio y posicionamiento (23 abril 2026) · VentureBeat, comparativa GPT-5.5 vs Claude Mythos Preview (23 abril 2026) · The Decoder, análisis técnico y precio (23 abril 2026) · Decrypt, cobertura de benchmarks y precios API (23 abril 2026) · BuildFastWithAI, revisión de benchmarks y escenarios de precio (24 abril 2026) · ArtificialAnalysis.ai, Intelligence Index (24 abril 2026).

Si te agrada nuestro contenido no olvides seguir visitando nuestro sitio Web Ellipsis Mx al igual seguirnos en nuestras redes sociales Facebook , Twitter e Instagram.

OpenAI lanza GPT-5.5: más potente, más autónomo y el doble de caro en la API

Qué es GPT-5.5 y qué lo hace diferente

Los benchmarks: dónde gana y dónde no

Lo que revelan los números

El precio de GPT 5.5: el doble, con justificación parcial

Disponibilidad de GPT 5.5: quién tiene acceso y desde cuándo

El dato de seguridad que OpenAI no puede ignorar

Qué significa para quienes usan IA en su trabajo

Si desarrollas software o construyes agentes

Si usas IA para análisis, investigación o trabajo de conocimiento

Si evalúas el costo de la API para un producto

El contexto que rodea el lanzamiento de GPT 5.5

Entradas Relacionadas

Luis Cortina

Deja un comentarioCancelar respuesta

Qué es GPT-5.5 y qué lo hace diferente

Los benchmarks: dónde gana y dónde no

Lo que revelan los números

El precio de GPT 5.5: el doble, con justificación parcial

Disponibilidad de GPT 5.5: quién tiene acceso y desde cuándo

El dato de seguridad que OpenAI no puede ignorar

Qué significa para quienes usan IA en su trabajo

Si desarrollas software o construyes agentes

Si usas IA para análisis, investigación o trabajo de conocimiento

Si evalúas el costo de la API para un producto

El contexto que rodea el lanzamiento de GPT 5.5

Comparte esto:

Entradas Relacionadas

Luis Cortina

Deja un comentarioCancelar respuesta

Entradas relacionadas

Anthropic presenta Claude for Teachers para llevar la IA al aula

Anthropic presenta Reflect, el panel de Claude pensado para ayudarte a usar menos la IA

GPT-Live: la nueva IA de voz de OpenAI que hace ChatGPT más humano

Lo más visto