ArXiv przestał udawać, że problem sam się rozmyje. Jeśli w zgłoszeniu pojawią się wyraźne ślady bezrefleksyjnego użycia LLM, platforma może nałożyć roczny zakaz publikacji i to od razu. Dla badaczy to sygnał prosty: z AI można korzystać, ale nie da się już zrzucić odpowiedzialności na model.

TL;DR

  • ArXiv wprowadza roczny ban za meta-komentarze lub hallucynowane referencje od LLM
  • Thomas Dietterich, przewodniczący sekcji informatyki, opisał zasady publicznie na X i w rozmowie z 404 Media
  • Autorzy odpowiadają za całość tekstu, także za fragmenty przygotowane z pomocą AI
  • Po zakończeniu bana kolejne zgłoszenia mają podlegać dodatkowym ograniczeniom związanym z wcześniejszą publikacją recenzowaną
  • Polityka ma dotyczyć tylko przypadków z mocnymi dowodami, a nie zwykłego wsparcia redakcyjnego

Dlaczego ArXiv zaostrzyło zasady wobec preprintów z LLM

ArXiv od dłuższego czasu mierzy się z tekstami, w których widać ślady pracy modelu językowego zostawione niemal wprost. W maju 2026 Thomas Dietterich, przewodniczący sekcji informatyki ArXiv, publicznie wyjaśnił nowe podejście platformy. Roczny ban za AI slop ma dotyczyć sytuacji, w których autorzy wrzucają pracę noszącą wyraźne oznaki tego, że nikt jej porządnie nie sprawdził.

Chodzi nie o samo użycie AI, ale o podpisanie własnym nazwiskiem treści z meta-komentarzami, pustymi placeholderami czy zmyślonymi cytowaniami. To ważne rozróżnienie: ArXiv nie ściga autorów za pomoc w redakcji, tylko za publikowanie czegoś, co wygląda jak szkic wypchnięty prosto z czatu.

Jakie sygnały ArXiv uzna za dowód nieczytania tekstu

Według publicznych wyjaśnień Thomasa Diettericha chodzi o przypadki, które da się udokumentować bez większej gimnastyki. Niepodważalne dowody to mają być na przykład hallucynowane referencje, pozostawione instrukcje w stylu „tu wstaw prawdziwe wyniki” albo inne fragmenty pokazujące, że autor nie przeczytał finalnej wersji.

To istotne, bo granica została ustawiona dość wąsko. Sama obecność stylu kojarzonego z LLM nie powinna wystarczyć. Moderator ma najpierw zebrać materiał, a decyzję o sankcji ma potwierdzić przewodniczący danej sekcji. W praktyce oznacza to procedurę administracyjną, a nie automatyczne flagowanie każdego tekstu, który brzmi zbyt gładko.

Co roczny ban oznacza dla autorów publikujących na ArXiv

Najprostsza zmiana brzmi banalnie, ale będzie bolała najbardziej: przed wysłaniem preprintu trzeba go po prostu przeczytać od początku do końca. Odpowiedzialność wraca do autora, nawet jeśli wstęp, streszczenie czy przegląd literatury powstały z pomocą modelu.

Dla części badaczy oznacza to dłuższy etap redakcji. Szczególnie tam, gdzie LLM służyły do szybkiego wygładzania angielszczyzny albo składania pierwszej wersji tekstu. Samo to nie jest problemem. Problem zaczyna się wtedy, gdy do zgłoszenia trafiają resztki promptów, sprzeczne przypisy albo cytowania prac, które najpewniej nigdy nie istniały.

Co ArXiv mówi o już opublikowanych pracach

Z dotychczasowych informacji wynika, że ArXiv nie szykuje wielkiego polowania na stare preprinty. Nie będzie masowej czystki. Platforma ma skupiać się przede wszystkim na nowych zgłoszeniach oraz na przypadkach wychwyconych przez moderatorów w toku zwykłej pracy.

To zresztą pasuje do wcześniejszych ruchów ArXiv. Platforma już wcześniej zaostrzała reguły dla niektórych typów publikacji, zwłaszcza tam, gdzie łatwo było hurtowo produkować powierzchowne przeglądy. Nowa polityka wygląda więc mniej jak nagły zwrot, a bardziej jak kolejny etap porządkowania systemu.

Co Thomas Dietterich dopowiada o odwołaniach i wyjątkach

Thomas Dietterich podkreślał, że sankcja nie ma obejmować zwykłego wspomagania pisania. Liczy się kontekst naruszenia. Jeśli autor użył ChatGPT czy innego modelu do korekty stylu, a potem sprawdził treść, taka pomoc sama w sobie nie powinna prowadzić do bana.

Jest też ścieżka odwoławcza, choć trudno udawać, że to komfortowa sytuacja dla autora. Gdy platforma uzna, że dowody są mocne, odkręcanie sprawy może być żmudne. I właśnie to jest chyba najskuteczniejszym elementem nowej polityki: nie odstrasza zakazem używania AI, tylko ryzykiem publicznej kompromitacji i utraty dostępu do ważnego kanału publikacji.

Jak nowe zasady ArXiv wpłyną na polskich badaczy

Dla osób publikujących z polskich uczelni zmiana będzie odczuwalna głównie organizacyjnie. Preprint wymaga teraz kontroli bardziej przypominającej końcową autoryzację niż szybki upload roboczej wersji. To może wydłużyć proces, ale raczej nie powinno blokować zespołów, które używają AI rozsądnie.

Jeśli już coś się zmieni, to zapewne obieg pracy: więcej wewnętrznego sprawdzania, mniej bezmyślnego kopiowania z narzędzi i ostrożniejsze podejście do referencji. W polskim kontekście to o tyle ważne, że dorobek liczony przez uczelnie i instytuty bywa mocno powiązany z tempem publikacji. ArXiv właśnie przypomina, że tempo nie zwalnia z odpowiedzialności.

Źródła:

The Verge, 404 Media, ArXiv.org, Thomas Dietterich on X, Jay Peters

Najczęściej zadawane pytania