OpenAI presenta GPT‑5 para desarrolladores en la API

TL;DR

OpenAI lanzó GPT‑5 en la plataforma API, descrito como el mejor modelo hasta la fecha para codificación y tareas agenticas, con rendimiento de referencia en benchmarks clave (74,9% SWE‑bench Verified; 88% Aider polyglot).
Controles nuevos para desarrolladores: un parámetro de verbosidad, un modo de razonamiento mínimo y un nuevo tipo de herramienta llamado herramientas personalizadas que aceptan texto plano y pueden ajustarse por gramáticas.
La API está disponible en tres tamaños: gpt‑5, gpt‑5-mini y gpt‑5-nano, brindando opciones de rendimiento, costo y latencia. En ChatGPT, GPT‑5 es el modelo de razonamiento; el modelo no razonante usado en ChatGPT está disponible como gpt‑5-chat-latest.
GPT‑5 mejora la inteligencia de herramientas, encadenando decenas de llamadas a herramientas, en secuencia o en paralelo, con mejor manejo de errores y recuperación de contexto largo. También puede generar explicaciones previas entre llamadas de herramientas.
Los primeros testers reportan buenos resultados en codificación, desarrollo frontend y tareas agenticas, destacando a GPT‑5 como un colaborador capaz para productos como Cursor, Windsurf, GitHub Copilot y Codex CLI. El modelo también demuestra capacidades notables de frontend y diseño.

Citas: las afirmaciones y resultados se reportan en los materiales de lanzamiento de OpenAI y socios. Consulte el enlace fuente para más detalles.

Contexto y antecedentes

El 7 de agosto de 2025, OpenAI anunció GPT‑5 en su plataforma API, presentándolo como el modelo más potente jamás creado para codificación y tareas agenticas. La compañía señala que GPT‑5 es de vanguardia en varios benchmarks y fue entrenado en tareas reales de codificación en colaboración con testers iniciales entre startups y empresas. El lanzamiento sitúa a GPT‑5 como un verdadero colaborador de codificación capaz de producir código de alta calidad, corregir errores, editar código y responder preguntas sobre grandes bases de código. En pruebas internas, GPT‑5 superó a modelos anteriores en desarrollo frontend y obtuvo resultados sólidos en tareas de contexto largo y orquestación compleja. El comunicado también enfatiza un uso más seguro y eficaz de herramientas: GPT‑5 sigue mejor las instrucciones de herramientas, maneja mejor los errores y encadena múltiples llamadas de herramientas, tanto en secuencia como en paralelo, sin perder el ritmo de tareas complejas. OpenAI también menciona mejoras en la recuperación de contexto largo y la capacidad de proporcionar actualizaciones de progreso en tareas agenticas más largas cuando se solicita. El anuncio de GPT‑5 destaca su rendimiento en benchmarks, incluyendo SWE‑bench Verified y Aider polyglot, y hace referencia a evaluaciones externas de equipos que usan GPT‑5 en proyectos reales. También se menciona que GPT‑5 supera a generaciones anteriores en una variedad de evaluaciones de seguimiento de instrucciones y llamadas a herramientas, con ganancias notables en desarrollo frontend y en tareas de razonamiento que requieren planificación en varias etapas. El lanzamiento también confirma que GPT‑5 en la API es el motor de razonamiento que impulsa el máximo rendimiento en ChatGPT, mientras que el modelo no razonante utilizado en ChatGPT está disponible como gpt‑5-chat-latest. Además, el GPT‑5 ha sido afinado para productos de codificación agentica como Cursor, Windsurf, GitHub Copilot y Codex CLI, y testers iniciales describen el modelo como altamente capaz, fácil de dirigir y rápido.

Qué hay de nuevo

Nuevos controles de API para desarrolladores: un parámetro de verbosidad con valores low, medium y high y un parámetro reasoning_effort que puede aceptar un valor mínimo para respuestas más rápidas con menos razonamiento inicial.
Un nuevo tipo de herramienta: herramientas personalizadas, que permiten llamar herramientas con texto plano y restringir su uso mediante gramáticas proporcionadas por el desarrollador.
Disponibilidad en tres tamaños: gpt‑5, gpt‑5-mini y gpt‑5-nano, para equilibrar rendimiento, coste y latencia.
GPT‑5 en la API es el modelo de razonamiento que impulsa el máximo rendimiento en ChatGPT; el modelo no razonante usado en ChatGPT está disponible como gpt‑5-chat-latest. Esta separación permite a los desarrolladores acceder a un modelo ajustado específicamente para escenarios de integración.
Muestras de cómo GPT‑5 puede ayudar con planes, actualizaciones y recapitulaciones entre las llamadas a herramientas, facilitando la gestión proactiva de flujos de trabajo ambiciosos y de varias etapas.
OpenAI está liberando públicamente BrowseComp Long Context, un nuevo benchmark para evaluar preguntas de contexto largo y medir capacidades de contexto extendido.

Por qué es importante (impacto para desarrolladores y empresas)

GPT‑5 representa un avance significativo para los desarrolladores que crean aplicaciones de codificación y tareas agenticas. La mayor capacidad de herramientas permite encadenar de forma fiable decenas de llamadas a herramientas, lo cual es crucial para la automatización real, la recopilación de datos y la orquestación compleja en grandes bases de código y equipos distribuidos. Los nuevos controles ofrecen a los desarrolladores mayor control sobre las respuestas, la longitud y el grado de razonamiento, permitiendo equilibrar latencia y profundidad de análisis. Los benchmarks reales muestran que GPT‑5 supera a modelos anteriores en tareas de codificación y edición de código, al tiempo que consume menos tokens y requiere menos llamadas a herramientas en condiciones de alto razonamiento. Testers tempranos señalan que GPT‑5 es un colaborador más inteligente y proactivo, capaz de proponer planes, estructurar proyectos, instalar dependencias, generar contenido, ejecutar builds y resumir el progreso conforme avanza. Para las empresas, el lanzamiento subraya el enfoque en entornos corporativos, con GPT‑5 diseñado para soportar flujos de trabajo de codificación y tareas agenticas en productos utilizados por desarrolladores e ingenieros. La capacidad de encadenar llamadas a herramientas en paralelo o en secuencia, manejar errores de herramientas de forma más robusta y recuperar información de contexto largo lo hace adecuado para automatización a gran escala e integración en bases de código grandes y equipos distribuidos.

Detalles técnicos o implementación

Los benchmarks citados incluyen: | Benchmark | GPT‑5 | Modelo anterior (cuando se indica) | Observaciones |---|---:|---:|---| | SWE‑bench Verified | 74,9% | 69,1% (o3) | Mayor eficiencia: 22% menos tokens de salida y 45% menos llamadas a herramientas en alto razonamiento |Aider polyglot | 88% | — | Desempeño récord; reducción de una tercera parte en la tasa de error frente a o3 |τ2‑bench telecom (llamadas a herramientas) | 97% | — | Fuerte rendimiento en llamadas a herramientas |Scale MultiChallenge (seguimiento de instrucciones) | 69,6% | — | Evaluación alineada con o3‑mini runner |OpenAI‑MRCR (recuperación de contexto a largo plazo) | Supera a o3 y GPT‑4.1 | — | Ventajas aumentan con entradas más largas | Los datos anteriores provienen de evaluaciones internas y de comentarios de testers. Además, GPT‑5 muestra mejoras notables en desarrollo frontend, siendo más estético, ambicioso y preciso en comparaciones con o3 en aproximadamente el 70% de las evaluaciones internas.

Notas técnicas sobre herramientas

Verbo sidad, razonamiento mínimo y herramientas personalizadas ofrecen mayor control sobre cómo GPT‑5 comunica, razona e interactúa con herramientas externas.
Las herramientas personalizadas permiten llamadas a herramientas en texto plano, ampliando integraciones sin exigir esquemas JSON rígidos.
Los tres tamaños de la API ofrecen trade‑offs; modelos grandes brindan mayor precisión y razonamiento más rico, mientras que variantes más pequeñas reducen costos y latencia para aplicaciones sensibles.
En ChatGPT, GPT‑5 se usa de forma diferente, con componentes de razonamiento, no razonamiento y enrutamiento; la versión de API está optimizada para rendimiento máximo en escenarios de integración.
Los primeros clientes señalan mejoras en tareas de codificación reales y en bases grandes de código, con capacidad para corregir errores, generar contenido y orquestar flujos complejos.

Puntos clave

GPT‑5 establece nuevos estándares para codificación y tareas agenticas en un entorno API y se presenta como un colaborador sólido para desarrollo.
Los desarrolladores obtienen mayor control mediante nuevos ajustes de verbosidad y razonamiento, así como la posibilidad de restringir el uso de herramientas con gramáticas personalizadas.
La API ofrece tres tamaños para equilibrar costo, latencia y rendimiento, con GPT‑5 en la API actuando como motor de razonamiento para flujos de trabajo de alto rendimiento.
Las mejoras en herramientas permiten orquestar de forma fiable decenas de herramientas, en serie o en paralelo, con manejo de errores más robusto y actualizaciones de progreso.
El feedback inicial de testers destaca capacidades en desarrollo frontend y tareas agenticas complejas, indicando amplia aplicabilidad en codificación, automatización y pipelines de entrega de software.

FAQ

Q: ¿Qué es GPT‑5 en la plataforma API?\n A: Es el modelo descrito como el mejor hasta la fecha para codificación y tareas agenticas, con rendimiento sólido en benchmarks y nuevos controles para desarrolladores.
Q: ¿Cuáles son los nuevos controles de API?\n A: Un parámetro de verbosidad y un parámetro reasoning_effort para respuestas más rápidas con menos razonamiento inicial, además de herramientas personalizadas que permiten llamadas en texto plano con gramáticas definidas por el desarrollador.
Q: ¿Cuántos tamaños existen y cuáles son?\n A: Tres tamaños: gpt‑5, gpt‑5-mini y gpt‑5-nano.
Q: ¿En qué se diferencia GPT‑5 de la API respecto a GPT‑5 en ChatGPT?\n A: La versión API es el modelo de razonamiento que maximiza el rendimiento; el modelo no razonante utilizado en ChatGPT está disponible como gpt‑5-chat-latest.