Rzadko widzi się taki układ: OpenAI i Nvidia sięgają po technologię Google DeepMind, choć na co dzień grają do własnej bramki. Tym razem chodzi o SynthID, czyli znakowanie treści generowanych przez AI. To może pomóc w walce z deepfake’ami, ale nie załatwia całego problemu.

TL;DR

  • OpenAI wdraża SynthID w obrazach z ChatGPT i API od maja 2026
  • Nvidia stosuje technologię w modelach Cosmos do audio, wideo i tekstu
  • Google DeepMind podaje, że SynthID oznaczył już ponad 100 miliardów obrazów i wideo oraz 60 tysięcy lat audio
  • Adopcja obejmuje też Kakao i ElevenLabs
  • Google łączy SynthID ze standardem C2PA, żeby utrudnić ukrywanie pochodzenia treści

Dlaczego OpenAI wdraża SynthID od Google DeepMind

OpenAI poinformowało podczas Google I/O 2026, że obrazy generowane przez ChatGPT i API będą automatycznie oznaczane za pomocą SynthID. SynthID trafia do OpenAI jako druga warstwa obok standardu C2PA. W praktyce chodzi o dwa różne mechanizmy: C2PA przenosi metadane o pochodzeniu pliku, a SynthID osadza niewidoczny znak, który ma przetrwać przynajmniej część edycji i kompresji.

To ruch ciekawy właśnie dlatego, że OpenAI nie bierze tu własnego rozwiązania i nie próbuje udawać, że wystarczy zamknąć temat we własnym ekosystemie. Firma od dawna mówi o wykrywaniu treści AI, ale wspólny standard daje większą szansę, że materiał da się sprawdzić także poza jedną aplikacją. Z punktu widzenia użytkownika to po prostu rozsądniejsze niż pięć różnych systemów, z których każdy działa tylko u siebie.

Jak Nvidia wykorzystuje SynthID w modelach Cosmos

Nvidia wdraża SynthID szerzej niż sam obraz. Według zapowiedzi technologia ma działać także w treściach audio, wideo i tekstowych generowanych przez modele Cosmos. Nvidia stawia na szerokie wdrożenie, co jest ważne nie dlatego, że firma nagle została arbitrem etyki AI, tylko dlatego, że jej infrastruktura stoi dziś pod sporą częścią rynku.

Jeśli taki gracz zaczyna znakować wyniki modeli, presja szybko przechodzi dalej: na dostawców modeli, platformy i firmy budujące gotowe aplikacje. To szczególnie istotne przy materiale wideo i głosie, bo właśnie tam deepfake’i najłatwiej wykorzystać w praktyce. Mówiąc brutalnie: fałszywy obraz szkodzi, ale fałszywe nagranie głosu prezesa albo polityka szkodzi zwykle szybciej.

Co Google DeepMind podaje o skali działania SynthID

Google DeepMind podaje, że od startu technologii w 2023 roku SynthID oznaczył już ponad 100 miliardów obrazów i wideo oraz 60 tysięcy lat audio. Skala jest już produkcyjna, a nie pokazowa. To odróżnia SynthID od wielu narzędzi, które dobrze wyglądają na scenie konferencyjnej, ale później znikają w laboratorium.

Jednocześnie trzeba zachować proporcje. Duża liczba oznaczonych materiałów nie jest jeszcze dowodem, że system zawsze zadziała w wykrywaniu albo że poradzi sobie z celowym obchodzeniem zabezpieczeń. Google twierdzi, że znak pozostaje wykrywalny po kompresji i lekkich zmianach pliku, ale pytanie o odporność na bardziej agresyjne przeróbki nadal pozostaje otwarte.

Po co Kakao i ElevenLabs dołączają do tego samego standardu

Do grona partnerów dochodzą też Kakao i ElevenLabs. Nie chodzi tylko o Google, ale o szerszy ruch w stronę wspólnego oznaczania treści. W przypadku ElevenLabs sprawa jest szczególnie czytelna: generowanie głosu to dziś jedno z najwrażliwszych pól, bo deepfake audio jest tani, szybki i często wystarczająco wiarygodny, by oszukać odbiorcę.

Dla firm taki wspólny standard to również zwykła kalkulacja. Jeśli każda platforma wdroży własny znak wodny, użytkownik i wydawca zostaną z bałaganem. Gdy kilka dużych marek zgadza się na jedno rozwiązanie, rynek dostaje przynajmniej punkt odniesienia. To jeszcze nie pełna zgodność branży, ale pierwszy krok wygląda sensownie.

Czym SynthID różni się od C2PA i własnych detektorów firm

Najłatwiej ująć to tak: C2PA i SynthID rozwiązują podobny problem, ale robią to inaczej. To nie są zamienniki. C2PA opiera się na metadanych i łańcuchu pochodzenia treści, więc jest przydatne tam, gdzie plik zachowuje swoje informacje. SynthID próbuje osadzić ślad bezpośrednio w samym materiale, dzięki czemu wykrywanie może działać także po częściowych zmianach.

Dlatego połączenie obu metod ma sens. Jeśli ktoś usunie metadane, znak osadzony w treści może nadal zostać. Jeśli znak będzie trudniejszy do wykrycia po mocnych przeróbkach, C2PA nadal może pomóc w potwierdzeniu źródła oryginału. Problem w tym, że żaden z tych systemów nie daje gwarancji absolutnej. To bardziej zestaw utrudnień niż magiczna pieczęć prawdy.

Co to oznacza dla użytkowników w Polsce i dla AI Act

Dla polskiego użytkownika najważniejsze jest to, że temat przestaje być wewnętrzną sprawą Doliny Krzemowej. AI Act zwiększa presję na oznaczanie treści syntetycznych, a wspólne standardy mogą ułatwić życie platformom, mediom i narzędziom weryfikacyjnym działającym także w UE. W praktyce łatwiej budować proces sprawdzania materiału, jeśli duzi gracze nie ciągną każdy w swoją stronę.

To jednak nie znaczy, że od jutra każdy deepfake będzie łatwo wykrywalny. Nadal zostaje masa treści generowanych przez modele bez watermarków, nadal zostają zrzuty ekranu, ponowne nagrania i przeróbki, które obchodzą część zabezpieczeń. Mimo to ruch OpenAI, Nvidii i Google można czytać jako sygnał, że rynek wreszcie uznał prosty fakt: bez wspólnego minimum porządek z treściami AI się po prostu nie zrobi.

Źródła:

Ars Technica, Mashable, The Verge, Google DeepMind, GuruFocus

Najczęściej zadawane pytania