Home Narzędzia AI ChatGPT OpenAI reaguje na popularność Claude Code. Nowa aplikacja już jest

OpenAI reaguje na popularność Claude Code. Nowa aplikacja już jest

Codex z nowym interfejsiem. OpenAI konkuruje z Claude Code

Sztuczna inteligencja wywiera coraz silniejszy wpływ na proces powstawania oprogramowania. Znaczna część powtarzalnych i czasochłonnych zadań programistycznych została już przejęta przez zespoły agentów oraz subagentów AI. Równocześnie deweloperzy testują nowe interfejsy i modele współpracy człowieka z maszyną. Tempo tych zmian okazuje się tak wysokie, że nawet czołowe laboratoria badawcze mają trudność z nadążeniem.

Na pierwszy plan wysuwa się obecnie agentowe tworzenie oprogramowania. W tym modelu systemy AI samodzielnie realizują konkretne zadania programistyczne. Wśród przykładów takich rozwiązań znajdują się Claude Code oraz Cowork. OpenAI rozwijało w tym samym czasie własne narzędzie Codex. W kwietniu ubiegłego roku firma zaprezentowała je jako narzędzie wiersza poleceń. Miesiąc później projekt zyskał wersję z interfejsem webowym.

OpenAI zdecydowało się teraz na wyraźne przyspieszenie działań. Firma uruchomiła aplikację Codex dla systemu macOS. Narzędzie łączy wiele praktyk agentowych, które zyskały popularność w ciągu ostatniego roku. Projektanci od początku zakładali równoległą pracę wielu agentów. Aplikacja integruje ich możliwości z innymi nowoczesnymi przepływami pracy.

Premiera nastąpiła niespełna dwa miesiące po debiucie GPT-5.2-Codex. To najpotężniejszy model OpenAI przeznaczony do programowania. Według firmy jego możliwości mają przekonać użytkowników Claude Code do zmiany narzędzia.

„Jeśli naprawdę chcesz wykonać zaawansowaną pracę nad czymś złożonym, 5.2 jest zdecydowanie najsilniejszym modelem”

– powiedział CEO Sam Altman reporterom podczas rozmowy prasowej.

I dodał, że jednak trudniej było się nim (modelem 5.2 przyp. red.) posługiwać, więc przeniesienie tego poziomu możliwości modelu do bardziej elastycznego interfejsu, będzie miało ogromne znaczenie.

Zapewnienia Altmana częściowo znajdują potwierdzenie w testach wydajności. GPT-5.2 zajmuje pierwsze miejsce w benchmarku TerminalBench, który mierzy skuteczność AI w zadaniach realizowanych z poziomu wiersza poleceń. Dane te obowiązywały w chwili publikacji wyników. Modele Gemini 3 oraz Claude Opus uzyskały jednak rezultaty bardzo zbliżone. Ich wyniki były nieco niższe, ale mieściły się w granicach błędu pomiarowego.

Podobne obserwacje płyną z testu SWE-bench. Ten benchmark sprawdza zdolność AI do naprawiania rzeczywistych błędów w oprogramowaniu. Także tutaj GPT-5.2 nie uzyskał wyraźnej przewagi. Dodatkowym problemem pozostaje trudność w rzetelnym porównywaniu zastosowań agentowych. Doświadczenia użytkowników z najbardziej zaawansowanymi modelami często znacząco się różnią.

Nowa aplikacja Codex oferuje zestaw funkcji, które według OpenAI mają umożliwić osiągnięcie parytetu z narzędziami Anthropica. W niektórych obszarach firma liczy nawet na przewagę. Codex pozwala tworzyć automatyzacje działające w tle zgodnie z ustalonym harmonogramem. Wyniki ich pracy trafiają do kolejki i czekają na przegląd po powrocie użytkownika.

Użytkownicy mogą także wybierać osobowości agentów. Do dyspozycji są warianty pragmatyczne oraz empatyczne. Rozwiązanie ma ułatwić dopasowanie stylu działania AI do indywidualnych preferencji.

Zdaniem OpenAI najważniejszym atutem pozostaje tempo tworzenia oprogramowania z pomocą AI.

„Możesz zacząć od czystej kartki, od zupełnie zera, i w ciągu kilku godzin stworzyć naprawdę dość zaawansowany kawałek oprogramowania”

– powiedział Altman.

Wersja na Windows ma być udostępniona niebawem.

Materiał powstał we współpracy z AI:

Pusto w komentarzach, może zaczniesz?

KOMENTARZE DO ARTYKUŁU:

Please enter your comment!
Please enter your name here

Exit mobile version