OpenAI présente GPT‑5‑Codex : code plus rapide, plus fiable et revues de code avancées
Sources: https://openai.com/index/introducing-upgrades-to-codex, OpenAI
TL;DR
- GPT‑5‑Codex est une version de GPT‑5 optimisée pour le codage guidé par agent dans Codex, conçue pour les sessions interactives rapides et les tâches longues et complexes.
- Il inclut des capacités de revue de code améliorées qui peuvent détecter des bugs critiques avant leur déploiement.
- Codex fonctionne désormais partout où vous développez : terminal, IDE, web, GitHub et l’application iOS de ChatGPT, avec des tâches cloud et locales via Codex CLI et l’extension IDE.
- Des améliorations de performance et de flux de travail incluent un chargement plus rapide grâce au cache, une configuration automatique de l’environnement, le partage d’images dans le CLI et une meilleure utilisation des outils externes.
- La sécurité est une priorité : Codex s’exécute par défaut dans un environnement sandbox, avec des contrôles de vie privée et de réseau configurables dans les environnements cloud et locaux.
Contexte et arrière-plan
Codex a évolué pour devenir un partenaire de codage plus efficace dans divers environnements. Les premières étapes incluaient le lancement de Codex CLI en avril et Codex web en mai, suivis de l’unification de Codex en une expérience produit unique connectée au compte ChatGPT il y a environ deux semaines. Cette unification permet de déplacer le travail entre cloud et local sans perdre le contexte et étend Codex au terminal, à l’IDE, au web, à GitHub et même à l’application iOS de ChatGPT. Codex est inclus dans les plans ChatGPT Plus, Pro, Business, Edu et Enterprise. OpenAI
Quoi de neuf
OpenAI présente GPT‑5‑Codex, une version de GPT‑5 encore plus optimisée pour l’ingénierie logicielle guidée par agent dans Codex. Elle est entraînée sur des tâches d’ingénierie du monde réel, notamment la construction de projets complets, l’ajout de fonctionnalités et de tests, le débogage, les refactors à grande échelle et la revue de code. Elle est plus pilotable et se conforme mieux aux instructions AGENTS.md, produisant un code de meilleure qualité sans nécessiter de longues consignes sur le style.
- Elle peut alimenter des tâches cloud et des revues de code par défaut et peut être utilisée pour des tâches locales via Codex CLI et l’extension IDE.
- Elle supporte un travail autonome sur de longues périodes (tests montrent plus de 7 heures sur des tâches lourdes) et reste réactive pour des demandes courtes ou des échanges interactifs.
- GPT‑5‑Codex a été évalué pour les revues de code, en naviguant dans les bases, en raisonnant sur les dépendances, et en exécutant du code et des tests pour valider le comportement.
- En tests, elle démontre une amélioration dans la qualité des commentaires de revue et une moindre probabilité d’être incorrecte ou hors sujet.
- Elle accepte des entrées visuelles dans le cloud (images ou captures d’écran) et peut afficher le progrès avec des captures d’écran de son travail.
- Le modèle est conçu pour Codex CLI, l’extension IDE de Codex, l’environnement cloud de Codex et GitHub, et prend aussi en charge l’utilisation d’outils variés. Contrairement à GPT‑5, il est recommandé spécifiquement pour des tâches de codage guidées par agent dans des environnements Codex ou similaires.
| Caractéristique | Détails |
|---|---|
| Disponibilité | Par défaut pour les tâches cloud et les revues de code; utilisable pour les tâches locales via Codex CLI et l’extension IDE |
| Accent de formation | Tâches d’ingénierie logicielle réelles, y compris projets complets, fonctionnalités, tests, débogage et refactors à grande échelle |
| Points forts | Plus rapide pour les demandes courtes, capable d’exécutions autonomes à long terme, revue de code améliorée, meilleure adéquation avec les objectifs |
| Sécurité | Environnement sandbox par défaut; accès réseau configurable; autorisations requises pour les actions dangereuses; restrictions réseau cloud |
| Outils et environnements | Codex CLI, extension IDE de Codex, environnement cloud, intégration GitHub, supporte les images dans CLI et le suivi de progrès |
- SWE-bench Vérifié : le modèle rend compte de 500 tâches SWE-bench et inclut des tâches de refactorisation en Python, Go et OCaml. Un PR d’exemple dans Gitea illustre des changements à grande échelle.
- Le modèle adapte son temps de réflexion en fonction de la complexité et peut gérer des refactorings lourds tout en maintenant le rythme sur plusieurs heures. OpenAI
Pourquoi c’est important (impact pour les développeurs/entreprises)
- Un collègue plus rapide et fiable réduit les délais pour les questions rapides et les tâches d’ingénierie de longue durée.
- Les revues de code avancées permettent de détecter des défauts critiques plus tôt, réduisant la charge des réviseurs et augmentant la confiance avant la mise en production.
- L’expérience Codex unifiée, connectée au compte ChatGPT, permet de maintenir le contexte lors du passage du cloud au local et vice versa.
- Le support multi-environnement signifie que les développeurs peuvent travailler dans le terminal, les IDE, le web, GitHub et l’application mobile, s’alignant sur les flux modernes.
- Les contrôles de sécurité et les options de réseau aident à protéger le code et les données tout en permettant une automatisation productive dans des environnements fiables. OpenAI
Détails techniques ou Mise en œuvre
- Le Codex CLI a été reconstruit autour des flux de travail de codage guidés par agent, rendant l’agent plus capable et fiable. Il permet désormais d’attacher et partager des images (captures d’écran, maquettes, diagrammes) dans le CLI pour créer un contexte partagé et clarifier les décisions de conception. Une liste de tâches suit les progrès et la recherche sur le Web et MCP permettent de se connecter à des systèmes externes, avec un usage des outils plus précis. L’UI du terminal affiche les appels d’outils et les diffs du code plus clairement, et les modes d’approbation ont été simplifiés (lecture seule, automatique et accès total). Le contexte des conversations peut être compacté pour faciliter les sessions longues. OpenAI
- Dans l’IDE, l’extension Codex amène l’agent dans VS Code, Cursor et d’autres forks, permettant de prévisualiser les changements locaux, d’éditer le code avec Codex et de déplacer le travail entre cloud et local sans quitter l’éditeur. Vous pouvez créer des tâches cloud, suivre leur avancement et revoir des tâches achevées directement dans l’IDE, et ouvrir des tâches cloud dans l’éditeur pour maintenir le contexte. Des guides de démarrage rapide expliquent comment tirer le meilleur parti de l’extension IDE. OpenAI
- Dans le cloud, Codex peut regarder des images fournies, inspecter visuellement son progrès et joindre des captures d’écran au travail et sur les PRs. Les améliorations d’infrastructure incluent le caching des containers, réduisant de 90% le temps médian de complétion des nouvelles tâches et suivis. Codex peut configurer son propre environnement en scannant des scripts d’installation et en les exécutant, et peut récupérer des dépendances à l’exécution si l’accès Internet est configuré. Les réglages de sécurité peuvent être ajustés selon le niveau de risque; dans le cloud, l’accès réseau peut être limité à des domaines de confiance. Dans le CLI et l’extension IDE, les développeurs peuvent approuver des commandes avec accès total ou autoriser la recherche sur le web et les connexions MCP, élargissant les capacités tout en augmentant les risques. OpenAI
- Revue de code automatisée : Codex vérifie les PR au fil de leur progression, publie des analyses et peut appliquer des edits demandés. OpenAI indique que la majorité des PRs chez OpenAI bénéficient de revues par Codex, accélérant le rythme de livraison avec plus de confiance. Codex est conçu pour protéger le code et les données contre l’exfiltration, s’exécutant dans un environnement sandbox et demandant l’autorisation avant des actions potentiellement dangereuses. OpenAI
Points à retenir
- GPT‑5‑Codex est adapté au codage guidé par agent dans Codex, offrant des réponses plus rapides et un support robuste pour les tâches longues.
- Il renforce les revues de code et les tests pour améliorer la qualité logicielle et réduire la charge des réviseurs.
- Codex propose une expérience unifiée cross‑environnement connectée via un compte ChatGPT, facilitant le passage entre cloud et local.
- Les contrôles de sécurité et les options réseau configurables aident à protéger le code et les données tout en permettant l’automatisation.
- Les intégrations avec Codex CLI et l’extension IDE rapprochent l’agent de votre flux de travail, avec des fonctionnalités comme le partage d’images et le suivi des tâches.
FAQ
- Q: Qu’est-ce que GPT‑5‑Codex et en quoi se distingue-t-il de GPT‑5 ? A: C’est une version de GPT‑5 optimisée pour l’ingénierie logicielle guidée par agent dans Codex, entraînée sur des tâches réelles de codage et axée sur des sessions interactives et des tâches longues. OpenAI
- Q: Où Codex peut-il être utilisé avec cette mise à jour ? A: Par défaut, pour les tâches cloud et les revues de code, avec support des tâches locales via Codex CLI et l’extension IDE, et sur terminal, IDE, web, GitHub et l’application mobile ChatGPT. OpenAI
- Q: Comment fonctionne la revue de code avec GPT‑5‑Codex ? A: Il navigue dans les bases, raisonne sur les dépendances, exécute le code et les tests pour valider le comportement, publie des analyses sur le PR et peut appliquer les edits demandés. OpenAI
- Q: Qu’en est-il de la sécurité et du sandbox ? A: Codex s’exécute en environnement sandbox par défaut, avec accès réseau désactivé; il peut demander des permissions pour des actions dangereuses et les réglages de sécurité sont configurables. OpenAI
- Q: Quelles améliorations de performance sont mises en avant ? A: Le caching des containers réduit d’environ 90% le temps médian de complétion des nouvelles tâches et suivis; le modèle ajuste son temps de réflexion selon la complexité de la tâche. OpenAI
Références
- OpenAI : Introducing upgrades to Codex — https://openai.com/index/introducing-upgrades-to-codex
More news
Détection et réduction de scheming dans les modèles d IA : progrès, méthodes et implications
OpenAI et Apollo Research ont évalué le désalignement caché dans des modèles de frontière, observé des comportements de scheming et testé une méthode d’alignement délibératif qui a réduit les actions covertes d’environ 30x, tout en reconnaissant des limites et des travaux en cours.
Vers une Prédiction d’Âge : OpenAI Adapte ChatGPT aux Adolescents et aux Familles
OpenAI décrit un système de prédiction d’âge à long terme pour adapter ChatGPT aux utilisateurs de moins de 18 ans et de 18 ans et plus, avec des politiques adaptées, des mesures de sécurité et des contrôles parentaux à venir.
Teen safety, freedom, and privacy
Explore OpenAI’s approach to balancing teen safety, freedom, and privacy in AI use.
OpenAI, NVIDIA et Nscale lancent Stargate UK pour une IA souveraine au Royaume-Uni
OpenAI, NVIDIA et Nscale annoncent Stargate UK, une infrastructure d’IA souveraine offrant un pouvoir de calcul local au Royaume-Uni pour soutenir les services publics, les secteurs réglementés et les objectifs nationaux d’IA.
Addenda GPT-5-Codex : GPT-5 optimisé pour le codage agent et mesures de sécurité
Un addenda détaillant GPT-5-Codex, une variante de GPT-5 optimisée pour le codage dans Codex, avec des mesures de sécurité et une disponibilité multiplateforme.
Comment les utilisateurs emploient ChatGPT : adoption générale, tâches quotidiennes et valeur économique
Une étude à grande échelle d’OpenAI montre comment l’usage de ChatGPT couvre les tâches quotidiennes et le travail, avec une réduction des écarts de genre et une valeur économique dans la vie personnelle et professionnelle.