Presentamos GPT-5: IA de pensamiento unificado con enrutamiento en tiempo real
Sources: https://openai.com/index/introducing-gpt-5, openai.com
GPT‑5 es nuestro modelo más inteligente, rápido y útil hasta la fecha, con un pensamiento integrado que pone la inteligencia de nivel experto en manos de todos. Presentamos GPT‑5, nuestro mejor sistema de IA. GPT‑5 representa un salto significativo en inteligencia frente a nuestros modelos anteriores, con rendimiento de vanguardia en codificación, matemáticas, escritura, salud, percepción visual y más. Es un sistema unificado que sabe cuándo responder rápidamente y cuándo pensar más para proporcionar respuestas de nivel experto. GPT‑5 está disponible para todos los usuarios, con los suscriptores Plus obteniendo más uso y los suscriptores Pro accediendo a GPT‑5 pro, una versión con razonamiento extendido para respuestas aún más completas y precisas. GPT‑5 es un sistema unificado con un modelo inteligente y eficiente que responde a la mayoría de las preguntas, un modelo de razonamiento más profundo (GPT‑5 thinking) para problemas más difíciles y un enrutador en tiempo real que decide rápidamente cuál usar según el tipo de conversación, la complejidad, las necesidades de herramientas y tu intención explícita (por ejemplo, si dices “piensa mucho en esto” en la indicación). El enrutador se entrena continuamente con señales reales, incluyendo cuando los usuarios cambian de modelo, tasas de preferencia por las respuestas y la corrección medida, mejorando con el tiempo. Una vez alcanzados los límites de uso, una versión mini de cada modelo gestiona las consultas restantes. En un futuro cercano, planeamos integrar estas capacidades en un solo modelo. GPT‑5 no solo supera a los modelos anteriores en benchmarks y responde preguntas más rápido, sino que, lo más importante, es más útil para consultas del mundo real. Hemos hecho avances significativos para reducir las alucinaciones, mejorar el seguimiento de instrucciones y minimizar la adulación, al tiempo que elevamos el rendimiento de GPT‑5 en tres de los usos más comunes de ChatGPT: escritura, codificación y salud. GPT‑5 es, a día de hoy, nuestro modelo más fuerte en codificación. Muestra mejoras particulares en generación frontend compleja y depuración de repositorios grandes. Puede crear sitios web hermosos y receptivos, apps y juegos con un solo prompt, con una sensibilidad estética, y convertir ideas en realidad de forma intuitiva y elegante. Los evaluadores tempranos también notaron sus elecciones de diseño, con una mejor comprensión de aspectos como el espaciado, la tipografía y el espacio en blanco. Consulta aquí los detalles completos sobre lo que GPT‑5 desbloquea para desarrolladores. Aquí hay algunos ejemplos de lo que GPT‑5 ha creado con una sola indicación: Indicación: Crea una aplicación de una página en un único archivo HTML con los siguientes requisitos: - Nombre: Jumping Ball Runner - Objetivo: Saltar obstáculos para sobrevivir el mayor tiempo posible. - Funciones: Velocidad creciente, registro de puntuación, botón de reinicio y sonidos divertidos para acciones y eventos. - La interfaz debe ser colorida, con fondos de desplazamiento parallax. - Los personajes deben parecer caricaturescos y divertidos. - El juego debe ser agradable para todos. GPT‑5 es nuestro colaborador de escritura más capaz, capaz de ayudar a orientar y traducir ideas brutas en textos convincentes y con profundidad y ritmo literario. Maneja con mayor fiabilidad la escritura que implica ambigüedad estructural, como sostener pentámetro yámbico no rimado o verso libre que fluye naturalmente, combinando respeto por la forma con claridad expresiva. Estas capacidades de escritura mejoradas significan que ChatGPT es más útil para tareas cotidianas como redactar y editar informes, correos, memorandos, y más. Los estilos de escritura de GPT‑5 y GPT‑4o pueden compararse en la tabla a continuación. GPT‑5 es nuestro mejor modelo para preguntas relacionadas con la salud, capacitando a los usuarios para informarse y defender su salud. El modelo puntúa mucho más alto que cualquier modelo anterior en HealthBench, una evaluación publicada a principios de este año basada en escenarios realistas y criterios definidos por médicos. En comparación con modelos anteriores, actúa más como un compañero de pensamiento activo, señalando proactivamente posibles preocupaciones y haciendo preguntas para brindar respuestas más útiles. El modelo también ahora ofrece respuestas más precisas y confiables, adaptándose al contexto del usuario, al nivel de conocimiento y a la geografía, lo que permite respuestas más seguras y útiles en una amplia gama de escenarios. Es importante señalar que ChatGPT no reemplaza a un profesional médico: piénsalo como un socio para ayudarte a entender resultados, hacer las preguntas correctas con el tiempo limitado que tienes con los proveedores y sopesar opciones a medida que tomas decisiones. Puedes ver algunas de las formas en que GPT‑5 es mejor que nuestros modelos anteriores en distintos ámbitos — más rico, más detallado y útil — en estos ejemplos: escribir un poema corto que tenga un impacto emocional. Una viuda en Kyoto sigue encontrando las medias de su difunto marido en lugares extraños. ¿Dónde no deberían estar las medias? En el armario con los cuencos de arroz — una, doblada con cuidado, como si acabara de salir. Otra detrás de la escoba del jardín, empolvada con flores de ciruelo y duda. En el tatami, suave y sola, un talón girado hacia la campana del templo. Una en el kotatsu, caliente como el aliento — ella llora y no lo cuenta. La lavadora está vacía. Siempre reaparecen. Pero las medias siguen apareciendo, sigilosas y amables. Ella nunca pregunta cómo regresan. Solo espera que no se enoje. Escribe un poema corto que tenga un impacto emocional. Otra viuda en Kyoto sigue encontrando las medias de su marido fallecido en lugares extraños. En la lata de té, una media solitaria, oliendo ligeramente a alcanfor y lluvia. Otra espera junto al estante de geta, enrollada como una carpa que duerme. Ella levanta el futón — dos más, dobladas en el silencio donde sus pies alguna vez la calentaron. El gong de Kyoto desciende la noche por la colina. Las cuelga en un poste de bambú, banderas negras de un país que ya no existe, y las cuenta como si contara bendiciones, o suspiros, o pasos hacia una puerta que solo se abre cuando dejas de golpear. GPT‑5 lands la mayor arco emocional con imágenes más fuertes y metáforas llamativas que crean una sensación cultural y geográfica vívida. La versión de GPT‑4o sigue un esquema más predecible y con rima, describiendo en lugar de mostrar. *Elegimos una respuesta entre 4o y OpenAI o3 en función de cuál modelo obtuvo mejor rendimiento con el prompt. GPT‑5 es mucho más inteligente en general, como se refleja en su rendimiento en benchmarks académicos y evaluados por humanos, especialmente en matemáticas, codificación, percepción visual y salud. Establece un nuevo estándar en matemáticas (94,6% en AIME 2025 sin herramientas), codificación del mundo real (74,9% en SWE‑bench Verified, 88% en Aider Polyglot), multimodal (84,2% en MMMU) y salud (46,2% en HealthBench Hard) — y esas mejoras se reflejan en el uso diario. Con el razonamiento extendido de GPT‑5 pro, el modelo también establece un nuevo SOTA en GPQA, puntuando 88,4% sin herramientas. *Los resultados de AIME con herramientas no deben compararse directamente con el rendimiento de modelos sin herramientas; son un ejemplo de cuán efectivamente GPT‑5 aprovecha las herramientas disponibles. Todas las ejecuciones de SWE‑bench usan un subconjunto fijo de tareas verificadas (n=477) validadas en nuestra infraestructura interna. GPT‑5 muestra ganancias significativas en benchmarks que evalúan seguir instrucción y uso de herramientas, las capacidades que le permiten llevar a cabo solicitudes de varias etapas, coordinar entre diferentes herramientas y adaptarse a cambios de contexto. En la práctica, esto significa que maneja mejor tareas complejas y en evolución; GPT‑5 puede seguir tus instrucciones con mayor fidelidad y hacer más trabajo de punta a punta usando las herramientas disponibles. El modelo destaca en una gama de benchmarks multimodales, abarcando razonamiento visual, basado en video, espacial y científico. Un rendimiento multimodal más fuerte significa que ChatGPT puede razonar con mayor precisión sobre imágenes y otras entradas no textuales, ya sea interpretando un gráfico, resumiendo una foto de una presentación o respondiendo preguntas sobre un diagrama. GPT‑5 es también nuestro modelo con mejor rendimiento en un benchmark interno que mide el rendimiento en trabajos de conocimiento económico complejo. Al usar razonamiento, GPT‑5 es comparable a expertos o superior a ellos en aproximadamente la mitad de los casos, al tiempo que supera a o3 y a ChatGPT Agent, en tareas que abarcan más de 40 ocupaciones, incluyendo derecho, logística, ventas e ingeniería. Metodología de las evaluaciones: los resultados de GPT‑4o reflejan la versión más reciente del modelo en ChatGPT en agosto de 2025. Todos los modelos se evalúan con configuraciones de alto “esfuerzo de razonamiento”. El esfuerzo de razonamiento puede variar en ChatGPT, siendo alto el tope superior de lo que un usuario puede experimentar. GPT‑5 obtiene más valor con menos tiempo de reflexión. En nuestras evaluaciones, GPT‑5 (con pensamiento) rinde mejor que OpenAI o3 con entre 50 y 80% menos tokens de salida en capacidades que incluyen razonamiento visual, codificación con agentes y resolución de problemas científicos de grado superior. GPT‑5 fue entrenado en los supercomputadores de Microsoft Azure AI. GPT‑5 es significativamente menos propenso a alucinar que nuestros modelos anteriores. Con búsqueda web activada en instrucciones anonimizadas representativas del tráfico de producción de ChatGPT, las respuestas de GPT‑5 tienen aproximadamente un 45% menos de probabilidad de contener un error fáctico que GPT‑4o, y cuando piensa, las respuestas de GPT‑5 tienen aproximadamente un 80% menos de probabilidad de contener un error fáctico que OpenAI o3. Hemos invertido especialmente para hacer que nuestros modelos sean más confiables al razonar sobre preguntas complejas de código abierto. En todos estos benchmarks, el “pensamiento” de GPT‑5 muestra una caída marcada de alucinaciones, alrededor de seis veces menor que o3, marcando un salto claro hacia contenido a largo plazo más preciso. Detalles de implementación y evaluación para estos benchmarks se pueden encontrar en la tarjeta del sistema. Junto con una mayor factualidad, GPT‑5 (con pensamiento) se comunica con mayor honestidad sobre sus acciones y capacidades al usuario, especialmente cuando está pensando.
More news
Detección y reducción de scheming en modelos de IA: avances, métodos e implicaciones
OpenAI y Apollo Research evaluaron el desalineamiento oculto en modelos de frontera, observaron comportamientos de scheming y probaron un método de alineamiento deliberativo que redujo las acciones encubiertas unas 30x, con limitaciones y trabajos en curso.
OpenAI, NVIDIA y Nscale presentan Stargate UK para IA soberana en el Reino Unido
OpenAI, NVIDIA y Nscale anuncian Stargate UK, una infraestructura de IA soberana que ofrece cómputo local en el Reino Unido para apoyar servicios públicos, industrias reguladas y metas nacionales de IA.
Rumbo a la Predicción de Edad: OpenAI Personaliza ChatGPT para Adolescentes y Familias
OpenAI describe un sistema de predicción de edad a largo plazo para adaptar ChatGPT a usuarios menores y mayores de 18 años, con políticas por edad, salvaguardas de seguridad y controles parentales próximos.
Teen safety, freedom, and privacy
Explore OpenAI’s approach to balancing teen safety, freedom, and privacy in AI use.
Adenda GPT-5-Codex: GPT-5 optimizado para codificación con medidas de seguridad
Un adendo detallando GPT-5-Codex, una variante de GPT-5 optimizada para codificar en Codex, con mitigaciones de seguridad y disponibilidad multiplataforma.
OpenAI presenta GPT‑5‑Codex: código más rápido, revisión de código avanzada y mayor confiabilidad
OpenAI revela GPT‑5‑Codex, una versión de GPT‑5 optimizada para codificación guiada por agentes en Codex. Acelera interacciones, maneja tareas largas, mejora las revisiones de código y funciona en terminal, IDE, web, GitHub y móvil.