Anthropic nie próbuje tu wymyślać Claude’a od nowa. W wersji Opus 4.8 poprawia raczej to, co dla firm i zespołów ma znaczenie na co dzień: stabilność agentów, tempo pracy i kontrolę nad tym, ile „myślenia” model ma włożyć w zadanie. Jeśli te obietnice dowiozą się poza benchmarkami, to jest to aktualizacja ważniejsza, niż sugeruje sam numer wersji.
TL;DR
- Claude Opus 4.8 jest już dostępny, a Anthropic deklaruje brak zmian w podstawowej cenie względem Opus 4.7
- W claude.ai pojawiła się kontrola poziomu wysiłku modelu
- Claude Code dostał funkcję dynamic workflows do dużych, wieloetapowych zadań
- Anthropic podaje, że fast mode działa 2,5 raza szybciej i kosztuje trzy razy mniej niż wcześniej
- Firma chwali się poprawą wyników w benchmarkach agentowych, prawniczych i computer-use
Claude Opus 4.8 od Anthropic – co ogłosiła firma?
Anthropic ogłosiło premierę Claude Opus 4.8 w komunikacie opublikowanym na stronie firmy. Według tego wpisu model rozwija linię Opus 4.7 i ma poprawiać wyniki w kodowaniu, zadaniach agentowych, rozumowaniu oraz pracy na dłuższych sesjach. Opus 4.8 jest już dostępny, a Anthropic deklaruje, że podstawowy cennik pozostaje taki sam jak przy Opus 4.7.
Najważniejsze nowości są dwie. Pierwsza to kontrola poziomu wysiłku w claude.ai, czyli możliwość ustawienia, jak dużo czasu i zasobów model ma poświęcić na odpowiedź. Druga to „dynamic workflows” w Claude Code, które mają pomagać przy większych problemach rozbitych na etapy. Anthropic podaje też, że fast mode działa 2,5 raza szybciej i kosztuje trzy razy mniej niż wcześniej.
Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the ability to work independently for longer than its predecessors.
— Claude (@claudeai) May 28, 2026
Available today at the same price. pic.twitter.com/EufxL7T1kb
Jak Anthropic opisuje poprawę agentów w Claude Opus 4.8?
W komunikacie Anthropic nacisk pada głównie na to, że Claude Opus 4.8 lepiej zachowuje się w pracy agentowej: częściej dopytuje, gdy brakuje kontekstu, łatwiej wychwytuje własne błędy i rzadziej brnie w zły plan tylko dlatego, że już zaczął. To akurat brzmi sensownie, bo przy agentach problemem bywa nie sam brak „inteligencji”, tylko zbyt duża pewność siebie.
Firma przywołuje też benchmark Super-Agent i twierdzi, że Opus 4.8 ukończył wszystkie przypadki end-to-end. To mocna teza, ale na razie oparta na materiale producenta. Dla czytelnika ważniejsze jest więc nie to, czy model wygrał tabelkę, tylko czy w realnej pracy zrobi mniej głupich skrótów i zostawi mniej poprawek po człowieku.
Co benchmarki prawne i computer-use mówią o Opus 4.8?
Anthropic podaje, że na Legal Agent Benchmark Claude Opus 4.8 osiągnął najlepszy wynik w historii tego testu i jako pierwszy przekroczył próg 10% w wariancie all-pass. To może mieć znaczenie dla zespołów pracujących na dokumentach, ale z jednym zastrzeżeniem: benchmark prawniczy nie jest tym samym co gotowość do pracy w kancelarii czy dziale compliance. To nadal wynik laboratoryjny, a nie gwarancja jakości porady prawnej.
W testach computer-use i browser-agent firma wskazuje z kolei wynik 84% na Online-Mind2Web. Jeśli ten skok przełoży się na praktykę, Claude powinien lepiej radzić sobie z obsługą interfejsów, formularzy i zadań wykonywanych krok po kroku w przeglądarce. Dla firm oznacza to mniej ręcznego pilnowania agenta, a w Polsce także łatwiejsze uzasadnienie kosztu wdrożenia w złotówkach, nie tylko w punktach benchmarku.
Claude Opus 4.8 kontra wcześniejsze wersje Opus
Z opisu Anthropic wynika, że Opus 4.8 nie jest nowym rozdaniem, tylko dopracowaniem wcześniejszej serii. Firma podkreśla poprawę spójności, jakości osądu i pracy na długim kontekście. To brzmi mniej efektownie niż wielkie hasła o nowej generacji modeli, ale dla użytkownika bywa ważniejsze. Tu liczy się stabilność, nie sam pokaz siły.
W porównaniu z Opus 4.7 i 4.6 Anthropic obiecuje lepsze trzymanie stylu, mniej błędów wymagających ręcznej korekty i wyższą „gęstość” odpowiedzi. Innymi słowy: mniej waty, więcej konkretu. Jeśli faktycznie tak jest, to zespoły korzystające z Claude’a do kodu, researchu i automatyzacji dostają aktualizację, która oszczędza czas, a nie tylko poprawia materiał do slajdów.
Co dynamic workflows i fast mode zmieniają w Claude Code?
Najciekawsza część tej premiery może wcale nie dotyczyć samego modelu, tylko sposobu pracy z nim. Dynamic workflows w Claude Code mają pozwalać na rozbijanie dużych problemów na etapy i przechodzenie między nimi bez jednego, sztywnego przebiegu. Dla zespołów budujących bardziej złożone procesy to różnica między „fajnym demo” a narzędziem, które da się wpiąć do codziennej roboty. Claude Code dostaje praktyczny upgrade.
Do tego dochodzi fast mode. Według Anthropic jest on 2,5 raza szybszy i trzy razy tańszy niż wcześniej. To ważne zwłaszcza tam, gdzie liczy się wolumen: automatyczne podsumowania, analiza zgłoszeń, kod generowany seryjnie albo agent obsługujący wiele prostszych zadań równolegle.
New in Claude Code (research preview): dynamic workflows.
— ClaudeDevs (@ClaudeDevs) May 28, 2026
Claude writes an orchestration script on the fly, then spins up a large fleet of coordinated subagents in parallel to take on your most complex tasks.
Use the word „workflow” in a prompt to get started. pic.twitter.com/re4SG3AyDm
Co Claude Opus 4.8 oznacza dla rynku agentów AI?
Anthropic od dłuższego czasu próbuje zająć pozycję dostawcy modeli, które może nie robią największego hałasu, ale są przewidywalne w pracy. W tym sensie Opus 4.8 pasuje do tej strategii. Zamiast opowieści o magii AI dostajemy nacisk na zachowanie modelu w długich zadaniach i na koszt użycia. To ruch pod firmy, nie pod jednorazowy zachwyt w social mediach.
Jeśli ta aktualizacja faktycznie zmniejsza liczbę błędów i skraca czas wykonania zadań, Anthropic umacnia się w segmencie agentów dla zastosowań profesjonalnych. Zobacz: jak Anthropic budowało Claude 4.7. Dla rynku to też sygnał, że wyścig nie toczy się już wyłącznie o benchmarki, ale o to, który model najmniej męczy użytkownika.
Źródła:
https://www.anthropic.com/news/claude-opus-4-8, Anthropic official announcement, YouTube leaks analysis May 2026
