Ina-update ng OpenAI ang Codex gamit ang kontrol sa computer at memorya

  • Nakakapag-integrate ang Codex sa computer: kinokontrol nito ang mga desktop app, tinitingnan ang screen, at ginagamit ang sarili nitong cursor nang hindi nakakaabala sa gumagamit.
  • Gumagamit ang ahente ng bagong memorya, muling ginagamit ang mga pag-uusap, at awtomatiko ang mga pangmatagalang gawain kung saan maraming ahente ang nagtatrabaho nang sabay-sabay.
  • Kabilang dito ang isang integrated browser, pagbuo ng imahe gamit ang gpt-image-1.5, at pinahusay na suporta para sa mga workflow ng developer.
  • Ang update ay unang dumating sa macOS; sa Europa at UK, ang ilang feature ay naantala dahil sa regulasyon ng data.

Pag-update ng Codex gamit ang kontrol ng computer

Ang OpenAI ay gumawa ng isa pang hakbang sa pagsasama ng artipisyal na katalinuhan sa pang-araw-araw na paggamit ng computer sa pamamagitan ng ganap na pagbabago sa Codex, ang desktop code agent nito. Ang tool, na dating kilala pangunahin dahil sa tulong nito sa programming, ngayon ay nagiging isang assistant na may kakayahang humawak ng mga application, matandaan ang mga kagustuhan, at pamahalaan ang mga proyekto nang halos walang kahirap-hirap.

Sa pamamagitan ng update na ito, mas pinalalapit ng kumpanyang pinamumunuan ni Sam Altman ang plano nito sa paglikha ng isang Isang desktop na "super app" na pinag-iisa ang ChatGPT, Codex, at ang iyong Atlas browserNilalayon ng hakbang na gawing simple ang karanasan ng gumagamit, pag-isiping mabuti ang mga mapagkukunan sa iisang workspace, at harapin ang mga karibal tulad ng Anthropic, lalo na sa kapaligiran ng pagbuo ng software at advanced automation.

Natututo ang Codex na gamitin ang kompyuter tulad ng ibang gumagamit

Isa sa mga pinakakapansin-pansing pagbabago ay ang Codex ay maaari na ngayong kontrolin ang computer sa backgroundNakikita ng ahente ang nasa screen, nagagalaw ang sarili nitong cursor, nag-click, nagta-type ng teksto at tumutugon sa nangyayari sa mga naka-install na application, nang hindi naaantala ang ginagawa ng user gamit ang mouse o keyboard.

Ang kakayahang ito ay nagbibigay-daan sa maraming ahente ng Codex na magtulungan nang sabay-sabay sa iisang koponanKabilang dito ang pagsasagawa ng mga pagsubok, pagpapalit ng mga configuration, o pagsasagawa ng mga paulit-ulit na gawain habang ang tao ay nagpapatuloy sa kanilang mga normal na aktibidad. Binubuksan nito ang pinto sa pag-automate ng mga workflow na dating nangangailangan ng patuloy na pangangasiwa, tulad ng pagsubok sa isang application pagkatapos ng bawat pagbabago ng code o paulit-ulit na mga aksyon sa interface.

Iminumungkahi ng OpenAI ang tungkuling ito bilang isang paraan para gumana ang assistant gamit ang mga kagamitang walang API o mga direktang integrasyon, isang bagay na karaniwan sa maraming programa sa desktop. Ang Codex, sa pamamagitan ng "pagkakita" sa screen at pagkontrol sa cursor, ay maaaring makipag-ugnayan sa mga application na ito tulad ng gagawin ng isang taong gumagamit, bagama't sa ngayon ay nasa isang kontroladong paraan at may espesyal na atensyon sa seguridad.

Ayon sa kompanya, ang paggamit ng kompyuter ay unang magagamit sa macOS sa pamamagitan ng Codex desktop application, naka-link sa isang ChatGPT account. Darating ang bersyon ng Windows mamaya, kapag nasubukan na ang pagganap at naangkop na ang mga tampok sa kapaligiran ng Microsoft.

Sa kaso ng Europa at United Kingdom, kinumpirma ng OpenAI na ang kontrol sa computer, advanced na pagpapasadya, mga mungkahing kontekstwal, at memorya Ia-activate ang mga ito mamaya. Ang dahilan ay ang pangangailangang isaayos ang mga tampok na ito sa mga regulasyon sa proteksyon ng datos, isang partikular na mahigpit na kinakailangan sa European Union at sa merkado ng Britanya.

Codex na may memorya at kontrol ng app

Pinagsamang browser at direktang trabaho sa mga web page

Pinapalakas din ng update ang ugnayan ng Codex sa web salamat sa isang browser na isinama sa loob mismo ng applicationSa halip na basta makatanggap lamang ng mga pangkalahatang tagubilin sa teksto, ang ahente ay maaaring direktang makatanggap ng mga utos sa mga partikular na elemento ng isang pahina.

Sa pagbuo ng frontend, halimbawa, magagawa ng gumagamit Pumili ng web component at ilarawan ang pagbabago. May gustong gawin ang gumagamit (tulad ng pagbabago ng kulay, laki ng teksto, o layout ng isang bloke), at nauunawaan ng Codex ang instruksyon sa loob ng partikular na kontekstong biswal na iyon. Naiiwasan nito ang pagsusulat ng mahahabang prompt na nagpapaliwanag kung aling bahagi ng site ang kailangang baguhin.

Pinapayagan din ng naka-embed na browser na ito ang Codex Suriin ang nilalaman, mangalap ng impormasyon, at gamitin ito bilang konteksto Para sa iba pang mga gawain, tulad ng pagdodokumento ng code, pagsusuri ng mga detalye ng produkto, o paghahambing ng teknikal na dokumentasyon, lahat ay ginagawa sa loob ng parehong kapaligiran, nang hindi kinakailangang lumipat sa pagitan ng maraming window ng operating system.

Pagbuo at pag-eedit ng mga imahe gamit ang gpt-image-1.5

Ang isa pang haligi ng bagong bersyon ng Codex ay ang integrasyon ng modelo gpt-image-1.5 para sa paglikha at pagbabago ng mga imahe Mula sa loob mismo ng desktop application, maaaring bumuo ang agent ng mga tsart, diagram, mockup, o visual sketch mula sa teksto, o sa pamamagitan ng pagsasama-sama ng mga tagubilin sa mga screenshot at mga snippet ng code.

Ang kakayahang ito ay direktang nakatuon sa mga pangkat na nagtatrabaho sa disenyo ng produkto, mga user interface, o mga prototype ng video gameHalimbawa, maaaring kumuha ang isang developer ng screenshot ng isang hindi pa tapos na interface, humingi ng mungkahi sa Codex para sa muling pagdisenyo ng menu o isang bagong scheme ng kulay, at kumuha ng mga nabuong larawan na akma sa kontekstong iyon, nang hindi binabago ang mga tool.

Dahil ang lahat ay nakasentro sa Codex, magagawa ng mga ahente pagdugtungin ang mga gawain sa coding at disenyo: isulat ang lohika ng isang functionality, i-update ang kaukulang frontend at bumuo ng visual mockup na ipapakita sa team, nang hindi umaalis sa workflow o kinakailangang magbukas ng mga external graphic editing application.

Memorya, konteksto, at pangmatagalang automation ng gawain

Higit pa sa pagkontrol ng computer at pagbuo ng imahe, ang malaking taya ng OpenAI sa bersyong ito ay bigyan ang Codex ng patuloy na memorya at mas malawak na pamamahala ng kontekstoMaaaring gamitin muli ng tool ang mga nakaraang pag-uusap, pangalagaan ang mahahalagang impormasyon, at makuha ito kapag kinakailangan upang ipagpatuloy ang isang proyekto.

Ang tampok na memorya, na inilalabas sa preview, ay nagbibigay-daan sa Codex tandaan ang mga personal na kagustuhan, madalas na pagwawasto, o datos na mahirap kolektahinKabilang dito ang lahat mula sa karaniwang technology stack ng isang team hanggang sa kung paano inaayos ang mga folder, ang mga pinakakaraniwang ginagamit na format ng ulat, at ang tag na karaniwang ginagamit sa GitHub para sa ilang partikular na uri ng isyu.

Gamit ang naipon na kontekstong iyon, magagawa ng ahente proaktibong magmungkahi ng mga gawainMaaari itong gamitin upang magmungkahi ng pagpapatuloy ng isang hindi natapos na proyekto, magrekomenda ng nakabinbing refactoring, o abisuhan ang mga gumagamit ng matagal nang mga pull request. Ginagamit na ito ng ilang kumpanya upang subaybayan ang mga pag-uusap sa Slack, Gmail, o Notion at tumugon kapag naganap ang ilang partikular na kaganapan.

Maaari ring planuhin ang trabaho para sa hinaharap at muling buhayin ang iyong sarili nang nakapag-iisa para makumpleto ang mga pangmatagalang gawain. Halimbawa, maaari nitong pamahalaan ang isang pila ng mga pagsusuri ng code sa loob ng mga araw o linggo, tinutugunan ang mga komento at ina-update ang dokumentasyon nang hindi kinakailangang patuloy itong subaybayan ng developer.

Mahigit 90 add-on at pinahusay na suporta para sa mga developer

Upang makumpleto ang pagbabago, nagdagdag ang OpenAI ng halos 90 bagong plugin ng CodexKabilang dito ang mga integrasyon sa Microsoft Suite, GitLab Issues, Neon by Databricks, Render, at Superpowers, pati na rin ang suporta para sa mga MCP (Model Context Protocol) server. Ang layunin ay bigyan ang ahente ng mas maraming context source at mas malawak na operational capabilities.

Dahil sa mga plugin na ito, magagawa ng Codex mangalap ng impormasyon mula sa iba't ibang serbisyo at kumilos batay dito Mula sa iisang workspace, maaari mong suriin ang mga isyu sa GitLab, mag-query ng data sa isang Databricks environment, mag-update ng mga dokumento ng Office, o makipag-ugnayan sa mga serbisyo ng deployment, nang hindi pinipilit ang user na lumipat mula sa isang platform patungo sa isa pa.

Sa purong teknikal na antas, pinapalakas ng update ang karaniwang mga daloy ng trabaho ng developerNgayon, tinutulungan ka ng Codex na suriin ang mga pull request, pamahalaan ang maraming terminal tab nang sabay-sabay, kumonekta sa mga remote development environment sa pamamagitan ng SSH, at magbukas ng mga file na may rich preview, maging ito man ay mga PDF, spreadsheet, presentasyon, o mga dokumento sa iba pang mga format.

Ang lahat ng ito ay nakatuon sa isang pinag-isang karanasan na, ayon mismo sa OpenAI, ay nagbibigay-daan para sa mas mabilis na pag-unlad. sa lahat ng yugto ng siklo ng buhay ng softwareMula sa pagsulat ng unang code hanggang sa pagsubok, pag-deploy, pagdodokumento at pagpapanatili nito, kasama ang mga ahente ng AI na patuloy na nakikipagtulungan sa loob ng parehong desktop environment.

Availability, pokus sa mga developer, at sitwasyon sa Europa

Ang bagong bersyon ng Codex ay inilulunsad na sa aplikasyon sa desktop para sa macOS Para sa mga nagla-log in gamit ang isang ChatGPT account. Hindi lahat ng feature ay nangangailangan ng parehong uri ng subscription, at ang ilang mga advanced na feature ay maaaring depende sa plan na binili, tulad ng sa iba pang mga tool ng OpenAI.

Ipinaliwanag ni Thibault Sottiaux, direktor ng Codex, na ang update na ito Ito ay partikular na nakatuon sa mga developerBagama't ang layunin ay palawakin ito sa mas pangkalahatang madla sa hinaharap. Ang ideya ay ang mga teknikal na pangkat ang unang sasamantalahin ang mga bagong ahente at awtomatikong daloy ng trabaho at, sa paglipas ng panahon, ililipat ang modelong iyon sa mga gawain sa opisina, pamamahala ng dokumento, o personal na produktibidad.

Binibigyang-diin ng OpenAI na ang paggamit ng computing power at memory ay ipinapatupad gamit ang isang pamamaraan sa pagsunod sa seguridad at regulasyonIto ay lalong mahalaga sa European Union at United Kingdom. Dahil dito, ang mga advanced na feature sa pagpapasadya, mga mungkahing kontekstwal, persistent memory, at direktang kontrol sa operating system ay medyo matatagalan bago maging available sa mga pamilihang ito.

Sa anumang kaso, pinaninindigan ng kumpanya na ang ebolusyong ito ng Codex ay nagbubukas ng pinto sa isang desktop super-application na nakatuon sa matalinong automationkung saan ang mga AI agent ay hindi lamang tumutulong sa pagsulat ng code, kundi pati na rin sa pag-coordinate ng mga gawain, pag-aangkop sa istilo ng trabaho ng gumagamit, at pagpapanatili ng mga kumplikadong proyekto na tumatakbo sa loob ng matagalang panahon. Para sa mga software developer sa Europa, malinaw ang mensahe: may mga bagong kakayahan na paparating, ngunit may mga kinakailangang pagsasaayos upang magkasya sa loob ng umiiral na balangkas ng regulasyon.