OpenAI właśnie podkręciło swój generator obrazów w ChatGPT. ChatGPT Images 2.0 nie tylko rysuje lepiej, ale zaczyna myśleć – szuka faktów w sieci i produkuje całe serie spójnych grafik z jednego polecenia. Konkurencja z Google i Microsoft depcze po piętach, więc tempo rośnie.

TL;DR

  • ChatGPT Images 2.0 oparte na modelu GPT Image 2 generuje do 8 obrazów naraz
  • Zdolności myślenia pozwalają na wyszukiwanie w webie i rozumowanie struktury
  • Rozdzielczość do 2K, aspect ratios od 3:1 do 1:3
  • Lepsze wsparcie dla tekstu w japońskim, chińskim i hindi
  • Dostępne dla wszystkich użytkowników ChatGPT od dziś

Co wnosi GPT Image 2 pod maską

OpenAI oparło nową wersję na modelu GPT Image 2, który właśnie wjeżdża do ChatGPT oraz API. To nie jest zwykła kosmetyka czy zmiana filtrów – generator teraz znacznie sprawniej radzi sobie z precyzyjnymi instrukcjami, wzorowo zachowuje detale i w końcu renderuje tekst bez irytujących błędów. W porównaniu do grudniowej aktualizacji, gdzie inżynierowie skupili się głównie na edycji zdjęć, tym razem ekipa Sama Altmana idzie o kilka kroków dalej, stawiając na fundamenty jakości.

Zespół OpenAI podkreśla, że model o wiele lepiej łapie specyficzne charakterystyki zdjęć, pixel artu czy mangi, co docenią osoby zajmujące się prototypowaniem gier lub tworzeniem storyboardów. A skoro mowa o poprzedniej iteracji, sprawdźcie koniecznie GPT Image 1.5 – różnica w jakości bije po oczach już od pierwszego wpisanego promptu. To solidny fundament pod bardziej zaawansowane projekty wizualne.

Zdolności myślenia w akcji

Najciekawszą nowością jest bez wątpienia tryb myślenia, dostępny dla subskrybentów planów Plus, Pro i Business. Generator wyszukuje informacje w sieci, analizuje przesłane pliki i przeprowadza rozumowanie nad strukturą grafiki jeszcze przed jej faktycznym wygenerowaniem. Dzięki temu z jednego polecenia wychodzą spójne serie obrazów – na przykład kolejne strony mangi czy grafiki do mediów społecznościowych – zachowujące te same postacie i identyczny styl wizualny.

OpenAI chwali się, że model posiada wiedzę aktualną do grudnia 2025 roku i bez problemu radzi sobie z generowaniem działających kodów QR czy wizualnych objaśnień (explainerów). Na platformie X Sam Altman co prawda milczy, ale oficjalny wątek firmy pokazuje konkretne przykłady, które robią wrażenie. To wyraźny krok w stronę wizji, w której AI bierze na klatę znacznie więcej pracy: od surowego pomysłu aż po gotowy do publikacji asset graficzny.

Poprawki dla każdego użytkownika

Nawet osoby korzystające z darmowej wersji ChatGPT dostają od OpenAI solidne bonusy. ChatGPT Images 2.0 wspiera teraz rozdzielczość 2K oraz znacznie szerszy wachlarz proporcji – od panoramicznych 3:1, idealnych na nagłówki, po wysokie 1:3, które sprawdzą się na smartfonach. To świetna wiadomość dla twórców banerów czy plakatów, którzy wcześniej musieli ratować się zewnętrznymi narzędziami do skalowania obrazu.

Odnotowaliśmy też szczególny skok w renderowaniu tekstu poza alfabetem łacińskim, co dotychczas było piętą achillesową większości generatorów. Japoński, koreański, chiński, hindi czy bengali – litery w końcu nie przypominają przypadkowych hieroglifów i niosą realną treść. OpenAI obiecuje przy tym dużą spójność w oświetleniu i kompozycji, co ułatwia tworzenie profesjonalnych grafik marketingowych. Aktualizacja jest dostępna od ręki: wystarczy odświeżyć stronę lub zaktualizować aplikację mobilną.

ChatGPT Images 2.0 to nie tylko ładniejsze obrazki, to przede wszystkim spójność, której brakowało nam w codziennej pracy z AI.

Konkurencja nie śpi

OpenAI wyraźnie czuje na plecach oddech rynkowych rywali, którzy nie próżnują w wyścigu zbrojeń. Google promuje swój model Nano Banana Pro wewnątrz ekosystemu Gemini, a Microsoft dumnie prezentuje możliwości MAI-Image-2. Te narzędzia również celują w chirurgiczną precyzję i generowanie serii, jednak OpenAI wygrywa integracją z ChatGPT, który dla wielu pozostaje domyślnym środowiskiem pracy z tekstem i obrazem.

W tle obserwujemy rosnącą presję – od grudnia zeszłego roku rynek generatorów obrazów ewoluuje w szalonym tempie. OpenAI co prawda nie afiszuje się z suchymi benchmarkami, ale udostępnione przykłady mówią same za siebie i bronią się jakością. Pozostaje pytanie o koszty eksploatacji w ramach API – ceny prawdopodobnie zostaną utrzymane na standardowym poziomie, znanym nam już z modelu GPT-4o, co powinno uspokoić deweloperów budujących własne aplikacje.

Źródła:

The Verge, openai.com, https://x.com/OpenAI/status/2046670977145372771

Najczęściej zadawane pytania