Wyobraź sobie, że rzucasz modelowi AI totalnie chaotyczne zadanie: zbuduj aplikację z danymi NASA, przetestuj ją i dorzuć interakcje 3D. GPT-5.5 od OpenAI po prostu to robi, samodzielnie planując kolejne kroki i wyłapując błędy w locie. Firma chwali się największym skokiem w zadaniach agentycznych – od kodowania po skomplikowane arkusze – i to bez irytujących spowolnień.
TL;DR
- GPT-5.5 osiąga 82.7% w Terminal-Bench 2.0 – nowy lider w środowisku terminala
- Model działa z prędkością GPT-5.4, ale zużywa znacznie mniej tokenów
- Rollout ruszył dla użytkowników ChatGPT Plus, Pro i Codex; API wkrótce
- Przed premierą model przeszedł testy zespołów atakujących z 200 partnerami
- Znaczna poprawa w matematyce granicznej oraz testach cyberbezpieczeństwa
GPT-5.5 ogarnia agentyczne zadania
OpenAI przestało bawić się w półśrodki – GPT-5.5 to model skrojony pod realną robotę, a nie tylko generowanie tekstów o niczym. Zamiast prowadzić go za rączkę przy każdym prompcie, dajesz mu wieloetapowe zadanie, a on sam planuje ścieżkę, dobiera narzędzia i dowozi gotowy wynik. To prawdziwa maszyna do pisania kodu, debugowania i robienia researchu online, która nie potrzebuje niańki do sprawdzania każdego przecinka.
Model szczególnie błyszczy w kodowaniu agentycznym, obsłudze systemów operacyjnych i wstępnych badaniach naukowych. To te obszary, gdzie liczy się głęboki kontekst i działanie w czasie rzeczywistym, a nie tylko zgadywanie kolejnego słowa. Dan Shipper z Every twierdzi, że to pierwszy model z „poważną klarownością koncepcyjną” – GPT-5.5 bez zająknięcia ogarnął refaktoryzację aplikacji, na której poległ starszy GPT-5.4.
Pietro Schirano z MagicPath testował go w boju i mergował branche z setkami zmian w zaledwie 20 minut. Model bez problemu utrzymuje kontekst ogromnych systemów, radzi sobie z błędami, które dla innych są niejednoznaczne, i samodzielnie propaguje zmiany w całym środowisku pracy. Wygląda na to, że era „AI jako asystenta” powoli ustępuje miejsca „AI jako samodzielnemu pracownikowi”.
Introducing GPT-5.5
A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done.
Now available in ChatGPT and Codex. pic.twitter.com/rPLTk99ZH5
— OpenAI (@OpenAI) April 23, 2026
Benchmarki pokazują skok inteligencji
OpenAI sypie konkretnymi liczbami, a te są dla konkurencji dość bolesne. GPT-5.5 wykręca lepsze wyniki niż GPT-5.4 w niemal każdym teście, zachowując przy tym tę samą prędkość generowania. Mamy więc identyczną latencję per-token, ale dzięki większej efektywności model zużywa ich po prostu mniej na to samo zadanie. W rankingu Artificial Analysis Coding Index to obecnie absolutny state-of-the-art, oferowany za połowę ceny rynkowych rywali.
W testach takich jak Terminal-Bench 2.0, który sprawdza poruszanie się w terminalu, czy SWE-Bench Pro, model rozwiązuje trudne zgłoszenia z GitHuba w jednym podejściu. Nawet wewnętrzny test Expert-SWE, symulujący 20 godzin ludzkiej pracy programistycznej, padł pod naporem nowej inteligencji. OpenAI udowadnia, że optymalizacja architektury daje więcej niż tylko dorzucanie kolejnych terabajtów danych do treningu.
| Benchmark | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | 69.4% | 68.5% |
| Expert-SWE (Internal) | 73.1% | 68.5% | – | – |
| GDPval (wins/ties) | 84.9% | 83.0% | 80.3% | 67.3% |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | – |
| Toolathlon | 55.6% | 54.6% | – | 48.8% |
| FrontierMath Tier 4 | 35.4% | 27.1% | 22.9% | 16.7% |
| CyberGym | 81.8% | 79.0% | 73.1% | – |
Powyższa tabela jasno pokazuje, że GPT-5.5 Pro odjeżdża stawce w BrowseComp i FrontierMath. Podczas gdy Claude Opus 4.7 i Gemini 3.1 Pro wciąż próbują gonić poprzednią generację, OpenAI ustawiło poprzeczkę na poziomie, który dla wielu będzie nieosiągalny przez najbliższe miesiące. To nie jest ewolucja, to brutalny pokaz siły w czystej matematyce i logice.
Bezpieczeństwo nie jest na papierze
OpenAI nie wypuściło GPT-5.5 w dzicz bez kagańca – to ich najlepiej zabezpieczony model w historii. Zanim trafił do publicznego dostępu, przeszedł przez młynek rygorystycznych frameworków bezpieczeństwa. Przeprowadzono szeroko zakrojone testy zespołów atakujących, które sprawdzały podatność na jailbreaki oraz potencjalne zagrożenia w obszarach cyberbezpieczeństwa i biologii molekularnej.
Firma zebrała feedback od blisko 200 zaufanych partnerów, zanim zdecydowała się na szeroki release. Warto zauważyć, że dostęp przez API będzie obwarowany dodatkowymi filtrami, bo skalowanie agentycznych działań to zupełnie inna para kaloszy niż czatowanie w przeglądarce. OpenAI stawia sprawę jasno: statystyki nadużyć spadają, mimo że model stał się znacznie potężniejszy w rękach specjalistów.
Rollout GPT-5.5 i co to znaczy dla ciebie?
Jeśli płacisz za ChatGPT Plus, Pro, Business lub Enterprise, to GPT-5.5 prawdopodobnie już na ciebie czeka. Model trafił też do środowiska Codex, a programiści korzystający z najwyższych planów dostali dostęp do wersji Pro. Co z API? OpenAI każe jeszcze chwilę poczekać, dopracowując ostatnie detale techniczne z partnerami infrastrukturalnymi, ale to kwestia tygodni, a nie miesięcy.
Strategia jest prosta: budowa globalnej infrastruktury pod agentyczne AI, które nie tylko pisze maile, ale realnie wykonuje pracę. Po roku dominacji w inżynierii oprogramowania, teraz czas na naukę i codzienną biurową dłubaninę. Podobnie jak w przypadku GPT-5.4, który zaczął przejmować kontrolę nad kursorem, nowa wersja idzie o krok dalej w stronę pełnej autonomii.
GPT-5.5 is here! We hope it’s useful to you. I personally like it.
— Sam Altman (@sama) April 23, 2026
Testerzy z takich gigantów jak NVIDIA czy Cursor nie szczędzą pochwał, mówiąc wprost o „wyższej inteligencji koncepcyjnej”. Sam Altman przyznał, że to obecnie jego ulubiony model do codziennych zadań. Pytanie tylko, jak szybko konkurencja otrząśnie się z szoku i czy w ogóle ma jeszcze czym odpowiedzieć na to tempo narzucone przez ekipę z San Francisco.
Źródła:
openai.com/index/introducing-gpt-5-5/, TechCrunch, The Verge, Bloomberg, VentureBeat, nvidia.com/blog/openai-codex-gpt-5-5-ai-agents
