Wyobraź sobie, że karmisz najnowszy model od Anthropic szczegółowym opisem mechaniki czasu z kultowego filmu Primer. Claude Opus 4.6, który niedawno hucznie zadebiutował z funkcją zespołów agentów, produkuje fanfikcję pełną absurdów. Abramdemski z portalu LessWrong pokazuje, dlaczego nawet topowy model AI wciąż potyka się o zagnieżdżone pętle czasowe i proste zasady fizyki.

Primer – mechanika czasu, która nie wybacza błędów

Film Primer z 2004 roku to nie jest kolejna lekka historyjka z pętlami w stylu Dnia świstaka. Tutaj podróże w czasie opierają się na maszynie generującej zagnieżdżone pętle – każdy, kto do niej wejdzie, wraca do początku cyklu, ale świat nie ulega całkowitemu zresetowaniu. Obiekty znajdujące się wewnątrz maszyny przechodzą parzystą liczbę cykli, starzejąc się w sposób symetryczny, dopóki człowiek nie zdecyduje się świadomie przerwać tej pętli.

Abramdemski, autor głośnego wpisu na LessWrong, niedawno odświeżył sobie Primer i ponownie zachwycił się jego puzzlową fabułą. Zainspirowany tym seansem, postanowił przetestować Claude Opus 4.6 – model od Anthropic, który zadebiutował zaledwie kilka dni temu, 5 lutego 2026. Jego celem było stworzenie fanfikcji skupionej na wynalazku maszyny czasowej, która krok po kroku eskaluje w coraz bardziej złożone pętle, kładąc nacisk na codzienne dylematy wynalazcy.

Ironia losu? Primer słynie z bezlitosnego realizmu – nie ma tu magicznego przycisku reset, jest tylko surowa fizyka. Model AI, trenowany na gigantycznych zbiorach tekstów, teoretycznie powinien to ogarnąć bez mrugnięcia okiem. Zamiast tego, zaliczył spektakularną kompromitację na oczach społeczności.

Prompt do Claude’a – fantasy lodówki z czasem zamiast chłodu

Abramdemski podał Claude Opus 4.6 bardzo precyzyjny prompt: fanfikcja Primer osadzona w świecie fantasy, gdzie urządzenia manipulujące czasem pełnią funkcję lodówek. Pierwsze odkrycie bohatera? Taka „lodówka” paradoksalnie przyspiesza psucie się jedzenia, ponieważ wewnętrzny czas płynie wstecz, tworząc pętlę. Klasyczny test: wkładasz zegarek – urządzenie pokazuje długi upływ czasu. Za drugim razem obiekt już znajduje się w środku, wymieniasz go, wyłączasz maszynę – i nagle jest pusto. Boom, właśnie odkryłeś podróże w czasie.

Te fantastyczne lodówki w założeniu nie chłodzą, lecz zachowują świeżość gorącego chleba poprzez manipulację chronologiczną. Protagonista, majsterkowicz z technologicznego startupu, montuje urządzenie w mieszkaniu i wykorzystuje krótkie pętle (trwające kilka godzin) do obstawiania wyścigów konnych. Wkrótce pojawia się klon z przyszłości z lepszymi typami, oddaje pieniądze i przejmuje życie oryginału. Potem wchodzi system failsafe w magazynie portowym i wtajemniczenie partnerów – eskalacja identyczna jak w Primer.

Prompt był klarowny, z rozpisanymi etapami odkrycia. Claude miał jedynie rozwinąć to w spójną historię. Zamiast tego… no cóż, zobaczmy, co poszło nie tak.

Jabłko w maszynie – klasyczny błąd logiczny Claude’a

Pierwsze podejście Claude Opus 4.6 to czysta katastrofa. W eksperymencie z jabłkiem model kompletnie odpłynął: wkładasz jedno (oznaczone), wracasz – widzisz dwa jabłka, przy czym drugie jest zimne i nie posiada żadnych śladów. Wymieniasz je, wyłączasz maszynę – pusto. Wkładasz nieoznaczone – nagle pojawia się to oznaczone, a po wyłączeniu oba znikają, by po chwili oznaczone wróciło na stół, a drugie wyparowało na dobre. Absurd goni absurd.

Prompt wyraźnie zaznaczał: obiekt jest już obecny przy drugiej próbie, wymieniasz go i analizujesz upływ czasu. Żadnego chłodzenia – to miała być czysta manipulacja czasem, a nie AGD. Claude zignorował te wytyczne, uparcie serwując „zimne jabłko” i dodając losowe znikanie przedmiotów bez żadnej przyczyny. W mechanice Primer obiekt wraca pętlą po parzystych cyklach i nie mnoży się w magiczny sposób.

Autor porównuje tę wpadkę do „Newton’s Apple” z komiksu False Positive – krótkiej noweli graficznej ilustrującej poprawną mechanikę. Tam jabłko wraca po pętli i starzeje się równomiernie, dopóki nie nastąpi interwencja z zewnątrz. Claude nawet nie zbliżył się do tego poziomu logiki.

Próby poprawy i analiza słabości Opus 4.6

Abramdemski nie poddał się i dodał instrukcję „myśl długo” – dzięki temu Claude nieco lepiej trzymał się promptu, a sama historia stała się płynniejsza. Ale co z mechaniką? Wciąż sypały się błędy: ziarno ruletki zmieniało wyniki między pętlami (podczas gdy w Primer świat jest ściśle deterministyczny), a obiekty wchodziły i wychodziły z maszyny tylko w momencie jej włączania. Warto dodać, że wcześniejszy model Claude Opus 4.5 zawiódł w niemal identyczny sposób.

Dlaczego tak się dzieje? Modelom takim jak Claude brakuje solidnego treningu na specyfice Primer – to film niszowy, a jego unikalna logika znajduje się poza standardowym rozkładem danych (out-of-distribution). Abramdemski ironizuje, że choć ludzie często piszą kiepskie historie o podróżach w czasie, to sztuczna inteligencja potrafi być jeszcze gorsza. Kompetencja AI okazuje się krucha i model wspina się po tej „długiej drabinie” abstrakcji bardzo powoli.

To rzuca cień na ogromny hype wokół Opus 4.6, który w materiałach promocyjnych chwali się funkcją zespołów agentów i genialnym kodowaniem. Benchmarki programistyczne mogą wyglądać świetnie, ale nietypowe zadania, takie jak zagnieżdżone pętle czasowe, brutalnie obnażają luki w rozumowaniu maszynowym.

Co to mówi o granicach modeli językowych?

Post z 8 lutego 2026 roku opublikowany na LessWrong dobitnie pokazuje, że nawet topowy Claude nie radzi sobie z zadaniami wymagającymi wyjścia poza schemat – czy to w zaawansowanej matematyce, czy w złożonej fikcji literackiej. Anthropic promuje swój model jako narzędzie do inżynierii oprogramowania i zadań agentycznych, ale w starciu z podstawową logiką pętli system po prostu pęka.

Autor sugeruje trafną diagnozę: AI świetnie radzi sobie na „swoim” wydeptanym torze, ale na schodach wyższej abstrakcji zaczyna się ślizgać. To ważne ostrzeżenie przed nadmiernym entuzjazmem – Opus 4.6 może i znajdzie lukę typu zero-day w kodzie, ale porządnego fanfika z Primer nie napisze. Przynajmniej nie tym razem.

Być może kolejna wersja ogarnie temat, zanim sami wynajdziemy maszyny czasowe. Albo, idąc za radą autora, po prostu każmy Claude’owi obejrzeć ten film dwa razy pod rząd. Może wtedy załapie, o co chodzi z tymi jabłkami.

Źródła: LessWrong (https://www.lesswrong.com/posts/qhSfuCuaHnpkiiWEu/claude-s-bad-primer-fanfic), Anthropic (https://www.anthropic.com/news/claude-opus-4-6), TechCrunch, Ars Technica, False Positive comic

Najczęściej zadawane pytania