Anthropic nie próbuje tu wymyślać Claude’a od nowa. W wersji Opus 4.8 poprawia raczej to, co dla firm i zespołów ma znaczenie na co dzień: stabilność agentów, tempo pracy i kontrolę nad tym, ile „myślenia” model ma włożyć w zadanie. Jeśli te obietnice dowiozą się poza benchmarkami, to jest to aktualizacja ważniejsza, niż sugeruje sam numer wersji.

TL;DR

  • Claude Opus 4.8 jest już dostępny, a Anthropic deklaruje brak zmian w podstawowej cenie względem Opus 4.7
  • W claude.ai pojawiła się kontrola poziomu wysiłku modelu
  • Claude Code dostał funkcję dynamic workflows do dużych, wieloetapowych zadań
  • Anthropic podaje, że fast mode działa 2,5 raza szybciej i kosztuje trzy razy mniej niż wcześniej
  • Firma chwali się poprawą wyników w benchmarkach agentowych, prawniczych i computer-use

Claude Opus 4.8 od Anthropic – co ogłosiła firma?

Anthropic ogłosiło premierę Claude Opus 4.8 w komunikacie opublikowanym na stronie firmy. Według tego wpisu model rozwija linię Opus 4.7 i ma poprawiać wyniki w kodowaniu, zadaniach agentowych, rozumowaniu oraz pracy na dłuższych sesjach. Opus 4.8 jest już dostępny, a Anthropic deklaruje, że podstawowy cennik pozostaje taki sam jak przy Opus 4.7.

Najważniejsze nowości są dwie. Pierwsza to kontrola poziomu wysiłku w claude.ai, czyli możliwość ustawienia, jak dużo czasu i zasobów model ma poświęcić na odpowiedź. Druga to „dynamic workflows” w Claude Code, które mają pomagać przy większych problemach rozbitych na etapy. Anthropic podaje też, że fast mode działa 2,5 raza szybciej i kosztuje trzy razy mniej niż wcześniej.

Jak Anthropic opisuje poprawę agentów w Claude Opus 4.8?

W komunikacie Anthropic nacisk pada głównie na to, że Claude Opus 4.8 lepiej zachowuje się w pracy agentowej: częściej dopytuje, gdy brakuje kontekstu, łatwiej wychwytuje własne błędy i rzadziej brnie w zły plan tylko dlatego, że już zaczął. To akurat brzmi sensownie, bo przy agentach problemem bywa nie sam brak „inteligencji”, tylko zbyt duża pewność siebie.

Firma przywołuje też benchmark Super-Agent i twierdzi, że Opus 4.8 ukończył wszystkie przypadki end-to-end. To mocna teza, ale na razie oparta na materiale producenta. Dla czytelnika ważniejsze jest więc nie to, czy model wygrał tabelkę, tylko czy w realnej pracy zrobi mniej głupich skrótów i zostawi mniej poprawek po człowieku.

Co benchmarki prawne i computer-use mówią o Opus 4.8?

Anthropic podaje, że na Legal Agent Benchmark Claude Opus 4.8 osiągnął najlepszy wynik w historii tego testu i jako pierwszy przekroczył próg 10% w wariancie all-pass. To może mieć znaczenie dla zespołów pracujących na dokumentach, ale z jednym zastrzeżeniem: benchmark prawniczy nie jest tym samym co gotowość do pracy w kancelarii czy dziale compliance. To nadal wynik laboratoryjny, a nie gwarancja jakości porady prawnej.

W testach computer-use i browser-agent firma wskazuje z kolei wynik 84% na Online-Mind2Web. Jeśli ten skok przełoży się na praktykę, Claude powinien lepiej radzić sobie z obsługą interfejsów, formularzy i zadań wykonywanych krok po kroku w przeglądarce. Dla firm oznacza to mniej ręcznego pilnowania agenta, a w Polsce także łatwiejsze uzasadnienie kosztu wdrożenia w złotówkach, nie tylko w punktach benchmarku.

Claude Opus 4.8 kontra wcześniejsze wersje Opus

Z opisu Anthropic wynika, że Opus 4.8 nie jest nowym rozdaniem, tylko dopracowaniem wcześniejszej serii. Firma podkreśla poprawę spójności, jakości osądu i pracy na długim kontekście. To brzmi mniej efektownie niż wielkie hasła o nowej generacji modeli, ale dla użytkownika bywa ważniejsze. Tu liczy się stabilność, nie sam pokaz siły.

W porównaniu z Opus 4.7 i 4.6 Anthropic obiecuje lepsze trzymanie stylu, mniej błędów wymagających ręcznej korekty i wyższą „gęstość” odpowiedzi. Innymi słowy: mniej waty, więcej konkretu. Jeśli faktycznie tak jest, to zespoły korzystające z Claude’a do kodu, researchu i automatyzacji dostają aktualizację, która oszczędza czas, a nie tylko poprawia materiał do slajdów.

Co dynamic workflows i fast mode zmieniają w Claude Code?

Najciekawsza część tej premiery może wcale nie dotyczyć samego modelu, tylko sposobu pracy z nim. Dynamic workflows w Claude Code mają pozwalać na rozbijanie dużych problemów na etapy i przechodzenie między nimi bez jednego, sztywnego przebiegu. Dla zespołów budujących bardziej złożone procesy to różnica między „fajnym demo” a narzędziem, które da się wpiąć do codziennej roboty. Claude Code dostaje praktyczny upgrade.

Do tego dochodzi fast mode. Według Anthropic jest on 2,5 raza szybszy i trzy razy tańszy niż wcześniej. To ważne zwłaszcza tam, gdzie liczy się wolumen: automatyczne podsumowania, analiza zgłoszeń, kod generowany seryjnie albo agent obsługujący wiele prostszych zadań równolegle.

Co Claude Opus 4.8 oznacza dla rynku agentów AI?

Anthropic od dłuższego czasu próbuje zająć pozycję dostawcy modeli, które może nie robią największego hałasu, ale są przewidywalne w pracy. W tym sensie Opus 4.8 pasuje do tej strategii. Zamiast opowieści o magii AI dostajemy nacisk na zachowanie modelu w długich zadaniach i na koszt użycia. To ruch pod firmy, nie pod jednorazowy zachwyt w social mediach.

Jeśli ta aktualizacja faktycznie zmniejsza liczbę błędów i skraca czas wykonania zadań, Anthropic umacnia się w segmencie agentów dla zastosowań profesjonalnych. Zobacz: jak Anthropic budowało Claude 4.7. Dla rynku to też sygnał, że wyścig nie toczy się już wyłącznie o benchmarki, ale o to, który model najmniej męczy użytkownika.

Źródła:

https://www.anthropic.com/news/claude-opus-4-8, Anthropic official announcement, YouTube leaks analysis May 2026

Najczęściej zadawane pytania