Wyobraź sobie scenariusz, w którym wrzucasz fotkę z wakacji, a Gemini w odpowiedzi serwuje Ci gotowy utwór z pełnym wokalem i tekstem. Google DeepMind właśnie urzeczywistnia tę wizję dzięki Lyria 3 – swojemu najnowszemu modelowi do generowania muzyki. Brzmi to jak przednia zabawa, ale cała technologia ma swoje specyficzne haczyki, o których warto wiedzieć przed pierwszym odpaleniem.
TL;DR
- Lyria 3 generuje 30-sekundowe utwory z tekstu, zdjęć lub wideo, zawierające wokale i teksty
- Funkcja dostępna globalnie w Gemini dla użytkowników 18+ w 8 językach
- Technologia SynthID nakłada niewidoczny znak wodny na każdą wygenerowaną ścieżkę
- Model nie kopiuje konkretnych artystów, skupiając się na naśladowaniu stylów i nastrojów
- Wskazówki: precyzyjnie określaj gatunek, tempo i instrumenty, by uzyskać najlepsze efekty
Czym jest Lyria 3 i skąd się wzięła?
Lyria 3 to najświeższy model generatywny od Google DeepMind, który właśnie wylądował w ekosystemie aplikacji Gemini. Zespół inżynierów pod wodzą Ágostona Weisza i Andrei Agostinellego szlifował go przy wsparciu profesjonalnych producentów muzycznych, aby jak najlepiej oddać rytmikę, strukturę aranżacji i naturalny flow dźwięków. Model ten imponuje wysoką wiernością audio, potrafiąc stworzyć wszystko – od prostych dżingli reklamowych po wielowarstwowe kompozycje z wokalami w różnych językach.
W zestawieniu z wcześniejszymi iteracjami, takimi jak Lyria 2, obecna wersja oferuje użytkownikowi znacznie więcej kontroli kreatywnej nad takimi parametrami jak styl, tempo czy ogólna akustyka nagrania. Google lojalnie uprzedza, że to przede wszystkim narzędzie do twórczych eksperymentów, a nie próba wysłania muzyków na bezrobocie. Co ciekawe, wewnątrz Gemini otrzymasz też dedykowane okładki stworzone przez Nano Banana – inny model AI wyspecjalizowany w grafice.
Meet Lyria 3, our latest music generation model from @GoogleDeepMind. 🎶
Now, you can create custom music tracks in the @GeminiApp — just by describing an idea or uploading an image or video. pic.twitter.com/zfRQuAUhyV
— Google (@Google) February 18, 2026
Jak Gemini z Lyria 3 tworzy muzykę?
Wystarczy wpisać krótki opis lub przesłać grafikę, a Lyria 3 wyczaruje 30-sekundowy utwór z kompletnym instrumentarium, głosem i tekstem. Przykłady dostępne w oficjalnej galerii Gemini pokazują spory rozrzut stylistyczny: „Wonderland” to kojąca solówka na harfie, „Pizza or Tacos” uderza w klimaty disco pop z wyraźnym funkowym pulsem, a „Pixel Dream” to czysta nostalgia w klimacie 8-bitowym. Nic nie stoi na przeszkodzie, by miksować gatunki, łącząc np. ciężki metal z rapem czy indie folk z brzmieniami lat 80.
Cały proces jest banalnie prosty: Gemini analizuje Twój prompt tekstowy lub wizualny (zdjęcia i wideo prosto z telefonu), automatycznie dopisuje słowa piosenki i generuje grafikę na okładkę. Takie utwory są od razu gotowe do udostępnienia – możesz je pobrać i wrzucić na czat grupowy lub do social mediów. Pamiętaj jednak, że to nie jest fabryka całych albumów, ponieważ każdy wygenerowany klip trwa dokładnie 30 sekund.
Najlepiej zacząć zabawę od gotowych szablonów w galerii – wybierasz bazę, dopisujesz własne detale, a sztuczna inteligencja zajmuje się resztą. Przykładowo, zdjęcie zwykłej suszarki do włosów może stać się inspiracją do stworzenia „Dryer Love” w klimacie R&B z emocjonalnymi ad-libami w tle.
Triki na prompty, które brzmią profesjonalnie
Aby uniknąć tworzenia generycznych „windziarskich” melodyjek, Google sugeruje dopieszczanie promptów konkretnymi detalami. Istnieje kilka elementów, które drastycznie podnoszą jakość finalnego pliku – warto od nich zacząć, by efekt końcowy przypominał profesjonalne nagranie studyjne.
- Gatunek i epoka: np. synthpop prosto z lat 80. lub agresywna mieszanka metalu i rapu.
- Tempo oraz rytm: energetyczny numer taneczny kontra powolna, nastrojowa ballada.
- Instrumentarium: wyraziste solo na saksofonie lub przesterowane gitary z efektem fuzz.
- Charakter wokalu: lekki sopran kobiecy lub chrapliwy, rockowy baryton.
- Warstwa tekstowa: określ temat, np. „epicki weekend”, stosując tagi strukturalne typu [wers 1].
Umiejętne połączenie tych składowych potrafi zdziałać cuda, dając np. intymny indie folk z gitarą akustyczną i tekstem o spacerze z psem w deszczowy dzień.
Przykładowy, dopracowany prompt: „Utwór jazzowy bouncy o unoszących się wspomnieniach, z lekkim fortepianem i perkusją”. Warto testować różne warianty metodą prób i błędów – Lyria uwielbia eksperymenty, choć przyznajmy, że czasem potrafi uciec w dość skrajne przypadki brzmieniowe.
Gdzie i dla kogo Lyria 3 jest dostępna?
Nowa funkcja jest stopniowo wdrażana w aplikacji Gemini – w pierwszej kolejności na komputerach, a chwilę później trafi na urządzenia mobilne. Usługa jest dostępna globalnie wszędzie tam, gdzie działa asystent Google, pod warunkiem, że użytkownik ukończył 18 lat. Na starcie wspieranych jest 8 języków, w tym angielski, niemiecki, hiszpański, francuski, hindi, japoński, koreański oraz portugalski.
Google nie wprowadza dodatkowych limitów terytorialnych poza standardową dostępnością Gemini, jednak subskrybenci planów premium mogą liczyć na wyższe limity generowanych utworów. Zarówno konta osobiste, jak i te w ramach Google Workspace kwalifikują się do testów, o ile spełniony jest wymóg pełnoletności. Warto dodać, że w ramach YouTube Dream Track zasięg funkcji również rozszerzono na rynki poza USA.
A co z użytkownikami z Polski? Jeśli masz dostęp do Gemini, możesz śmiało testować nowość, jednak prompty i teksty piosenek będziesz musiał tworzyć np. po angielsku, ponieważ polski nie znalazł się jeszcze na liście oficjalnie wspieranych języków. My przetestowaliśmy narzędzie na własnej skórze – do Suno jeszcze mu bardzo daleko, więc na ten moment Lyria 3 to raczej „zabawka” warta odpalenia z czystej ciekawości niż realne narzędzie dla twórców.

Zabezpieczenia – bo AI nie kopiuje artystów
Google rygorystycznie podchodzi do kwestii praw autorskich i nie pozwala na bezpośrednie klonowanie znanych gwiazd. Wpisanie w prompt nazwiska konkretnego wykonawcy poskutkuje jedynie wygenerowaniem utworu w podobnym stylu lub nastroju, ale bez kopiowania barwy głosu. Specjalne filtry na bieżąco analizują rezultaty pod kątem plagiatu. Dodatkowo, każdy utwór jest znakowany przez system SynthID, czyli niewidoczny dla ucha znak wodny, który pozwala zidentyfikować dźwięk jako dzieło AI od Google.
Gemini potrafi również analizować przesyłane do niego pliki audio: sprawdza obecność SynthID i na tej podstawie ocenia, czy materiał pochodzi od sztucznej inteligencji. Ma to chronić rynek przed zalewem fałszywych streamów i próbami oszustw. Google zapewnia również, że dane treningowe zostały przefiltrowane tak, aby unikać generowania szkodliwych treści.
Patrząc na to krytycznym okiem: branża muzyczna wciąż głośno narzeka na wykorzystywanie chronionych utworów w procesie uczenia modeli, ale Google stara się gasić te pożary, dogadując się z wielkimi wytwórniami w kwestiach monetyzacji.
Źródła: https://gemini.google/pl/overview/music-generation/?hl=pl (źródło newsa); https://blog.google/innovation-and-ai/products/gemini-app/lyria-3; https://deepmind.google/models/lyria; https://gemini.google/overview/music-generation; https://techcrunch.com/2026/02/18/google-adds-music-generation-capabilities-to-the-gemini-app; https://www.theverge.com/ai-artificial-intelligence/880584/google-gemini-ai-music-maker-lyria-3-beta; https://9to5google.com/2026/02/18/gemini-app-music-lyria-3
