ElevenLabs weszło głębiej w generowanie muzyki i tym razem nie chodzi o kosmetyczny update. Music v2 ma utrzymać spójność utworu nawet wtedy, gdy piosenka skręca z opery w heavy metal, a przy okazji daje edycję wybranych fragmentów i obietnicę bezpieczniejszego użycia komercyjnego.

TL;DR

  • Music v2 przełącza gatunki mid-track i dodaje efekty dźwiękowe
  • Użytkownicy mogą edytować wybrane fragmenty utworu promptami
  • Model buduje piosenki sekcja po sekcji i zszywa je w całość
  • Dane treningowe są w pełni licencjonowane – komercyjne użycie dozwolone
  • Dostępny teraz w ElevenMusic i ElevenCreative, wkrótce w ElevenAPI

Co ElevenLabs dodało w Music v2?

ElevenLabs ogłosiło Music v2 26 maja 2026 roku na firmowym blogu. Według opisu producenta model radzi sobie z nagłymi zmianami gatunku w trakcie jednego utworu, na przykład od opery do heavy metalu, bez wyraźnego rozpadu wokalu czy aranżacji. Ma też obsługiwać szybki rap i efekty dźwiękowe, które nie są klasycznymi instrumentami.

Nowością jest też edycja fragmentu utworu bez ruszania reszty. Użytkownik wskazuje konkretny odcinek i poprawia go promptem, zamiast generować całość od zera. ElevenLabs stawia również na składanie piosenki sekcja po sekcji: intro, zwrotka, refren i dalsze części można budować osobno, a potem połączyć w jeden numer. Edycja wycinków utworu brzmi tu ważniej niż samo hasło o „lepszej jakości”, bo daje twórcom realną kontrolę.

Co oznacza deklaracja ElevenLabs o licencjonowanych danych?

To jest najważniejsza część całej premiery, bo nie dotyczy brzmienia, tylko ryzyka. ElevenLabs deklaruje na swojej stronie i w materiałach o Music v2, że model opiera się wyłącznie na licencjonowanych danych oraz że utwory można wykorzystywać komercyjnie zgodnie z zasadami usługi.

Taki komunikat wybrzmiewa mocniej w momencie, gdy Suno i Udio mierzą się w USA z pozwami dotyczącymi praw autorskich. Samo hasło „licencjonowane dane” nie zamyka jeszcze każdej prawnej dyskusji, ale z perspektywy marek, agencji i studiów audio to dużo wygodniejszy punkt wyjścia niż model, wokół którego od początku wiszą sądowe znaki zapytania. Komercyjne użycie jest tu więc nie dodatkiem, tylko jednym z głównych powodów, dla których ten model może trafić do firmowych workflow.

Jak Music v2 wypada obok Google Lyria, Suno i Udio?

Na rynku nie brakuje dziś generatorów muzyki, ale firmy rozkładają akcenty inaczej. Google rozwija rodzinę Lyria i narzędzia do tworzenia muzyki powiązane z własnym ekosystemem wideo. Suno i Udio walczą o jakość, długość utworów i łatwość generowania gotowych piosenek.

ElevenLabs próbuje wejść bokiem: zamiast obiecywać tylko „lepszą muzykę”, sprzedaje kontrolę nad strukturą utworu i bezpieczniejszą ścieżkę dla zastosowań komercyjnych. Jeśli to działa tak dobrze, jak twierdzi firma, przewagą nie będzie sam sound, tylko możliwość poprawienia jednej sekcji bez demolowania całego projektu. Sekcja po sekcji to podejście bliższe pracy producenckiej niż zabawie jednym promptem.

Gdzie można już używać Music v2?

Model jest już dostępny w ElevenMusic oraz w ElevenCreative, czyli narzędziu kierowanym do zespołów marketingowych, brandingowych i kreatywnych. ElevenLabs zapowiada też wdrożenie do ElevenAPI, więc z czasem model powinien trafić również do zewnętrznych aplikacji i własnych procesów budowanych przez firmy.

Dla polskich agencji to może być po prostu praktyczne: łatwiej przygotować podkład do kampanii, krótką muzykę do wideo czy warianty dźwięku pod social media bez zamawiania wszystkiego od zera. Dostępność w produktach ElevenLabs sugeruje, że firma nie testuje już niszy, tylko układa gotową ofertę pod klientów biznesowych.

Dlaczego ElevenLabs wchodzi szerzej w muzykę właśnie teraz?

Bo audio zaczyna się spinać w jeden rynek. Jeszcze niedawno ElevenLabs kojarzyło się głównie z syntezą mowy i dubbingiem, ale ruch w stronę muzyki jest logiczny: firmy chcą dziś generować nie pojedynczy głos czy efekt, tylko cały pakiet audio do filmu, reklamy albo aplikacji.

Music v2 pokazuje, że ElevenLabs nie chce być wyłącznie dostawcą „ładnego lektora”. Buduje portfolio, w którym mowa, efekty i muzyka zaczynają działać obok siebie. Szersze portfolio audio ma sens biznesowy, bo klient woli kupić więcej elementów w jednym ekosystemie niż sklejać je z trzech różnych usług.

Co Music v2 realnie zmienia dla twórców?

Najwięcej zyskają ci, którzy traktują AI jako szkicownik, a nie maszynę do wypuszczania gotowych hitów jednym kliknięciem. Jeśli można poprawiać konkretne fragmenty, zmieniać klimat w środku utworu i składać numer warstwowo, to narzędzie zaczyna przypominać roboczy instrument, a nie generator losowych demówek.

Z drugiej strony rynek może zostać jeszcze bardziej zalany muzyką użytkową: bezpieczną, sprawną i trochę podobną do wszystkiego. To ryzyko nie dotyczy tylko ElevenLabs, ale całej kategorii. Większa kontrola twórcy jest więc dobrą wiadomością, choć ostatecznie i tak wygrają ci, którzy mają pomysł, a nie tylko dostęp do modelu.

Źródła:

TechCrunch, The Verge, ElevenLabs official blog, https://elevenlabs.io/blog/introducing-music-v2

Najczęściej zadawane pytania