Branża sztucznej inteligencji tonie w pozwach o kradzież własności intelektualnej, a wydawcy patrzą z przerażeniem na topniejący ruch z wyszukiwarek. Amazon wchodzi do gry z pomysłem na cyfrowe targowisko, gdzie media będą mogły legalnie sprzedawać swoje artykuły firmom rozwijającym AI. Brzmi jak koło ratunkowe czy kolejny sprytny haczyk giganta z Seattle?

TL;DR

  • Amazon buduje platformę, na której wydawcy będą legalnie sprzedawać treści do trenowania AI.
  • To sposób na uniknięcie pozwów o kradzież własności intelektualnej i zastąpienie dzikiego „scrapingu” licencjami.
  • Wydawcy, tracący ruch z wyszukiwarek, mają zarabiać na bezpośredniej sprzedaży artykułów gigantom technologicznym.
  • Amazon rzuca wyzwanie Microsoftowi, integrując sprzedaż treści ze swoimi usługami chmurowymi (AWS).
  • Choć to szansa na pieniądze, media stają przed dylematem „karmienia bestii”, która docelowo może je zastąpić.

Dlaczego dane medialne to skarb dla sztucznej inteligencji?

Firmy budujące sztuczną inteligencję od lat desperacko szukają legalnych źródeł danych treningowych. Zamiast ryzykować kosztowne procesy o naruszenie praw autorskich, coraz chętniej decydują się na zakup treści – choć dotychczasowe kontrakty to zaledwie kropla w morzu potrzeb. OpenAI podpisało już wieloletnie umowy z Associated Press, Vox Media, News Corp czy The Atlantic, płacąc za dostęp do archiwów artykułów niezbędnych do trenowania ChatGPT. Te porozumienia gwarantują dostęp do materiałów typu premium, ale ich skala nie rozwiązuje problemów całego rynku.

Pozwy sypią się lawinowo, bo wydawcy oskarżają technologicznych gigantów o bezprawny „scraping”, czyli masowe pobieranie danych bez zgody autorów. Amazon, widząc ten chaos, zamierza stworzyć centralną platformę – swoisty eBay dla tekstów dziennikarskich. To logiczny ruch, ponieważ bez dopływu świeżych informacji modele AI stają się wtórne i zwyczajnie nudne. Ironia losu polega na tym, że media, które tracą czytelników przez algorytmy, mogą nagle zacząć na tych samych algorytmach zarabiać.

Statystyki są bezlitosne: badania dowodzą, że podsumowania generowane przez AI w wynikach wyszukiwania Google obcinają liczbę kliknięć o 25-34 procent. Wydawcy boleśnie to odczuwają, dlatego wizja giełdy treści, na której można odzyskać część wpływów, wydaje się wyjątkowo kusząca.

Plany Amazonu: slajdy, spotkania i milcząca zgoda

Z raportu The Information wynika, że Amazon od kilku tygodni intensywnie konsultuje się z kadrą zarządzającą dużych wydawnictw, zapowiadając rychły start platformy handlowej. Tuż przed konferencją AWS dedykowaną wydawcom, która odbyła się we wtorek, gigant rozesłał materiały prezentacyjne. Umieszczono w nich nowy marketplace tuż obok kluczowych narzędzi AI, takich jak Bedrock czy Quick Suite. Przekaz jest czytelny: treści medialne mają stać się integralną częścią chmurowego ekosystemu Amazonu.

Rzecznik Amazonu, zapytany o sprawę przez redakcję TechCrunch, nie zaprzeczył tym doniesieniom. Ograniczył się do dyplomatycznego stwierdzenia:

„Amazon buduje długoterminowe, innowacyjne relacje z wydawcami w obszarach AWS, handlu, reklam, sztucznej inteligencji ogólnej i Alexy. Zawsze wspólnie wprowadzamy innowacje dla klientów, ale na ten moment nie mamy do przekazania nic konkretnego”.

To klasyczny korporacyjny unik – brak oficjalnego potwierdzenia przy jednoczesnym pozostawieniu szeroko otwartych drzwi.

Nowa platforma ma oddać władzę w ręce twórców, pozwalając wydawcom samodzielnie ustalać ceny i warunki licencji. Warto przypomnieć, że Amazon przecierał już szlaki, podpisując umowy z Hearst i Condé Nast na wykorzystanie treści w systemach AI wspierających zakupy online, co kosztowało firmę dziesiątki milionów dolarów rocznie.

Microsoft wyprzedził Amazon o krok

Mimo rozmachu, Amazon nie jest pionierem w tym segmencie. Microsoft niedawno uruchomił własną giełdę treści wydawców (Publisher Content Marketplace, PCM). To wyspecjalizowany hub licencyjny, w którym wydawcy mogą precyzyjnie zdefiniować, jak ich materiały mają być wykorzystywane w modelach AI. Firma z Redmond kusi media obietnicą „nowego strumienia przychodów”, a deweloperom oferuje „skalowalny dostęp do treści najwyższej jakości”.

PCM to świeża inicjatywa oparta na przejrzystym modelu ekonomicznym: koniec z domysłami, wydawcy otrzymują pełne dane o stopniu wykorzystania ich tekstów. Microsoft pozycjonuje swoje rozwiązanie jako bezpieczny most łączący świat mediów z twórcami agentów AI, co pozwala uniknąć prawnych pułapek. Wydawcy chwalą to rozwiązanie za prostotę i poczucie kontroli nad tym, co i za jaką kwotę trafia do obiegu.

W zestawieniu z konkurencją, Amazon wydaje się celować znacznie szerzej, stawiając na głęboką integrację z infrastrukturą AWS. Podczas gdy Microsoft koncentruje się na chmurze reklamowej, oba podejścia mają ten sam cel: znalezienie sposobu na legalne karmienie sztucznej inteligencji bez konieczności spotykania się w sądzie.

Co zyskają wydawcy, a co mogą stracić?

Dla branży medialnej to szansa na wypracowanie dochodów, które nie zależą wyłącznie od liczby wyświetleń reklam. Zamiast mozolnego negocjowania pojedynczych, limitowanych umów, giełda umożliwi masową sprzedaż zarówno archiwów, jak i bieżących newsów. Eksperci cytowani przez The Information sugerują, że to znacznie „bardziej zrównoważony model biznesowy” niż okazjonalne deale, szczególnie w czasach, gdy modele językowe pożerają coraz większe zasoby danych.

Oto kluczowe korzyści płynące z istnienia takiej platformy, o których dyskutuje się w kuluarach:

  • Transparentne mechanizmy wyceny i precyzyjne śledzenie wykorzystania treści
  • Pełna integracja z narzędziami AI, takimi jak Bedrock, co upraszcza proces transakcyjny
  • Skuteczna ochrona przed nielegalnym scrapingiem dzięki systemowi licencji

Oczywiście medal ma też drugą stronę: mniejsze redakcje mogą zostać zepchnięte na margines, a rynkowi giganci pokroju Amazonu mogą zacząć dyktować twarde warunki współpracy.

Trudno nie dostrzec tu pewnej ironii – wydawcy, którzy jeszcze niedawno walczyli z funkcjami AI Overviews „kradnącymi” im ruch, teraz sami będą karmić tę bestię. Czy to jedyny sposób na przetrwanie, czy może dobrowolne przyspieszanie końca tradycyjnego dziennikarstwa?

Co dalej dla branży treści i AI?

Trend tworzenia marketplace’ów z danymi przybiera na sile. Po Microsoft i Amazonie prawdopodobnie ruszą kolejni gracze. Regulatorzy nie śpią – nowe projekty ustaw biorą pod lupę dane treningowe, a sądy wciąż rozpatrują precedensowe pozwy. Jeśli model giełdowy się sprawdzi, dziki scraping może wkrótce stać się technologicznym reliktem przeszłości.

Amazon mierzy wysoko, celując w rozwój AGI (sztucznej inteligencji ogólnej), co wymaga dostarczania danych najwyższej próby. W tej rozgrywce wygranymi będą wydawcy z unikalnymi, historycznymi archiwami, podczas gdy rynek może zostać zalany masową produkcją tekstów o niskiej wartości. Jakie są prognozy? Eksperci spodziewają się wzrostu wartości rynku licencyjnego o dziesiątki procent w skali zaledwie jednego roku.

Podsumowując, obserwujemy próbę zawarcia pokoju: zamiast wyniszczających wojen na sali rozpraw, dostajemy aukcje danych. Pozostaje jednak otwarte pytanie: czy AI w swojej kolejnej iteracji nie znajdzie sposobu, by pożreć całą wiedzę świata zupełnie za darmo?

Źródła: TechCrunch (główny artykuł), The Information (raport o spotkaniach i slajdach), Microsoft Ads Blog (o PCM), Reuters, Publishers Weekly, The Verge, PYMNTS

Najczęściej zadawane pytania