GPT-5-Codex: Agentul OpenAI care programează și revizuiește codul

  • GPT-5-Codex este o variantă a GPT-5 optimizată pentru codarea bazată pe agenți în Codex.
  • Ajustează dinamic timpul de gândire de la câteva secunde la peste șapte ore, în funcție de sarcină.
  • Îmbunătățește revizuirea codului și detectarea erorilor critice, cu mai puține comentarii eronate.
  • Disponibil în versiunile Plus, Pro, Business, Edu și Enterprise; API-ul va fi disponibil ulterior.

Imagine generică a Codexului GPT-5

OpenAI a prezentat GPT-5-Codex, o variantă a modelului său generalist axat pe sarcini de programare bazate pe agenți în cadrul Codex. Scopul este de a permite echipelor să comute între sesiuni interactive și lucrul pe termen lung în fundal, fără a pierde contextul sau calitatea rezultatelor.

Compania subliniază faptul că modelul ajustează timpul petrecut raționamentului bazat pe complexitate: răspunde în câteva secunde la solicitări simple și poate investi ore întregi atunci când sarcina o cere. Această abordare, orientată spre ingineria software, include capabilități avansate de revizuirea codului și detectarea erorilor critice.

Ce este GPT-5-Codex și la ce servește?

Comparativ cu GPT-5 de uz general, această versiune a fost instruiți cu scenarii reale de dezvoltare cu cadre precum PyTorch pentru a crea proiecte de la zero, a adăuga funcționalități și teste, a depana, a refactoriza și a monitoriza modificările în mod constant.

Conform OpenAI, modelul este mai mult strict cu directivele agenților (AGENTS.md), deci urmați instrucțiunile mai bine, similar proiectelor precum OpenAssistantși produce cod de calitate superioară cu prompturi scurte, fără a fi nevoie să scrieți prompturi lungi.

Pe lângă programare, GPT-5-Codex poate evaluează corectitudinea prin rularea codului și a testelorși semnalează problemele de impact înainte ca acestea să intre în producție, ceea ce este util în special pentru echipele cu revizuiri solicitante.

În locurile de muncă de interfață, compania consideră că este o partener de încredere pentru sarcinile front-end și crearea de aplicații desktop, cu îmbunătățiri în generarea experienței mobile bazate pe evaluări interne ale preferințelor umane.

Toate cele de mai sus sunt integrate în fluxul obișnuit: Terminal (CLI), IDE, web, GitHub și aplicația ChatGPT, cu continuitate a contextului între cloud și mediul local.

Performanță și „timp de gândire” adaptabil

Una dintre cheile lansării este managementul raționamentului dinamicModelul însuși decide în timp real cât „efort” să dedice și poate prelungi execuția atunci când detectează că sarcina crește în complexitate.

OpenAI susține că a observat sesiuni independente de peste șapte ore în refactorizări la scară largă, cu iterații care corectează eșecurile testelor și validează rezultatele până când obiectivul este îndeplinit.

Acest comportament contrastează cu strategiile bazate pe routere care predetermină resurseleAici, modelul reevaluează efortul pe măsură ce acesta progresează, combinând dialogul agil cu execuția persistentă.

La nivel practic, aceasta se traduce prin răspunsuri rapide la solicitări specifice și mai mult timp investit atunci când munca implică orchestrarea modificărilor în mai multe module sau rezolvarea dependențelor complexe.

Pentru echipele de software, abordarea promite mai puține iterații irelevante și o mai mare concentrare pe etapele cu impact ridicat, în special atunci când se analizează depozite mari sau se abordează sarcini transversale.

Imagine conceptuală a unui agent de cod

Instrumente și integrare: CLI, IDE, web și GitHub

Interfața liniei de comandă Codex a fost reproiectat în jurul fluxurilor bazate pe agențiImaginile pot fi acum atașate direct în CLI pentru a facilita deciziile de design sau pentru a detecta inconsecvențele vizuale.

Sistemul poate monitorizați progresul cu liste de activități și integrează instrumente precum căutarea web și MCP, un standard deschis pentru conectarea în siguranță a LLM-urilor la date și utilități externe.

Interfața îmbunătățește, de asemenea, formatul apelurilor de instrumente și comparații, ceea ce ajută la urmărirea raționamentului agentului și la examinarea mai clară a diferențelor.

În mediile de dezvoltare, extensia IDE și integrarea GitHub permit Mută ​​munca între locație și cloud fără a pierde contextul, bazându-se pe sursa deschisă în editor pentru răspunsuri mai precise.

OpenAI indică faptul că agentul rulează pe medii controlate în mod implicit și că este posibilă ajustarea permisiunilor, pentru a limita acțiunile potențial distructive asupra proiectelor sensibile.

Disponibilitate si acces

GPT-5-Codex este activat în ChatGPT Plus, Pro, Business, Edu și Enterprise, pe lângă experiențele Codex în terminal, web, IDE și GitHub.

Compania intenționează să îl pună la dispoziția Clienți API mai târziu, deși momentan nu a detaliat un program sau prețuri specifice pentru canalul respectiv.

Teste și metrici Codex GPT-5

Conform informațiilor partajate de OpenAI și rapoartelor externe, GPT-5-Codex oferă rezultate mai bune decât GPT-5 în scenarii orientate pe agenți, cum ar fi benchmark-ul SWE-bench Verified.

În cifre concrete, acestea sunt menționate Îmbunătățiri de până la 74,5% în SWE-bench verificat și o creștere a testelor de refactorizare de la 33,9% cu GPT-5 la 51,3% cu GPT-5-Codex, ceea ce sugerează progrese în întreținerea și editarea mai multor fișiere.

Compania subliniază, de asemenea, că Comentariile din recenzii sunt mai puțin eronate sau irelevante, permițând concentrarea atenției asupra problemelor critice și reducând zgomotul din raportările personale.

Ce înseamnă Codexul GPT-5 pentru echipele tehnice

Pentru dezvoltatori, a avea un agent care combină interacțiunea rapidă și munca autonomă deschide ușa către cicluri mai scurte și o prioritizare mai eficientă a sarcinilor complexe.

În organizații, capacitatea unui model de a petrece ore întregi lucrând la o sarcină necesită o strategie de inteligență artificială la nivel de întreprindere, politici clare privind costurile și limitele de execuție și validarea performanței sale în mai multe limbaje și monorepo-uri cu context extins.

Practici de integrare sigură în fluxurile existente, cu controale de permisiuni, urmărirea deciziilor agenților și diferențe lizibile pentru a menține calitatea și trasabilitatea.

Cu accent pe ingineria software, GPT-5-Codex își propune să fie un contribuitor tehnic capabile să creeze, să revizuiască și să susțină proiecte complexe, ajustând efortul de calcul la dimensiunea reală a problemei și ridicând ștacheta pentru instrumentele de codare bazate pe inteligență artificială.

Red Hat
Articol asociat:
Red Hat își consolidează strategia de inteligență artificială pentru întreprinderi cu OpenShift AI, F5 și un ecosistem de agenți inteligenți.