Podrzuć AI trzy swoje fotki – jednej postaci, tła i tekstury – a dostaniesz osiem sekund pionowego wideo, które wygląda jak z TikToka. Google właśnie odświeżyło Veo 3.1, dodając natywne wsparcie dla formatu 9:16 i skalowanie do 4K. Przygotujcie się na jeszcze więcej scrollowalnego slopu, który udaje rzeczywistość.

Ulepszona funkcja materiałów referencyjnych do wideo

W Veo 3.1 Google skupiło się na funkcji materiałów referencyjnych do wideo, znanej wcześniej jako Ingredients to Video. Teraz możesz podać do trzech obrazów – na przykład jednej postaci do ożywienia, tła i faktury materiału – a model wygeneruje klip z mniejszą liczbą przypadkowych zmian. Spójność postaci, obiektów i otoczenia jest na wyższym poziomie, co pozwala na tworzenie dłuższych narracji poprzez wielokrotne generowanie klipów z zachowaniem tych samych elementów. Zmiana stylu czy ustawienia? Żaden problem, reszta zostaje nietknięta.

To nie jest przypadkowy skok jakościowy. Od października 2025, kiedy Veo 3.1 zadebiutowało z natywnym dźwiękiem i lepszą kontrolą narracji, ten update pogłębia kreatywność. Zespół z DeepMind podkreśla, że filmy stają się bardziej ekspresyjne, z bogatszym dialogiem i ruchem, bliższym prawdziwemu światu. W praktyce oznacza to, że amatorzy dostają narzędzia do szybkich klipów, a profesjonaliści – bazę pod montaż dłuższych produkcji.

Pionowe wideo natywnie – mobile first w akcji

Największa nowość to natywne generowanie wideo pionowego w proporcji 9:16 prosto z materiałów referencyjnych. Zapomnij o przycinaniu poziomego klipu – Veo 3.1 od razu produkuje format gotowy na YouTube Shorts, Instagram Reels czy TikToka. Klipy trwają osiem sekund, co idealnie pasuje do short-form contentu, choć składanie ich w dłuższe sekwencje wymaga trochę ręcznej roboty.

Google obiecało to latem zeszłego roku, a teraz spełnia słowo. Funkcja ruszyła w aplikacji Gemini, YouTube Shorts i YouTube Create. Ironia losu? Właściciel YouTube, dominujący na rynku wideo online, pcha nas w erę, gdzie AI wypełnia feedy nie dającymi się odróżnić od realu klipami. Twórcy social media pewnie już ostrzą pazury.

Skalowanie do 4K – ale nie wszędzie

Veo 3.1 generuje filmy bazowo w rozdzielczości 720p, ale teraz oferuje skalowanie w górę do 1080p i 4K dla ostrzejszych detali i bogatszych tekstur. 1080p nadaje się do edycji, 4K do wielkoekranowych produkcji. Wsparcie dla 1080p pojawiło się rok temu, ale ten update poprawia jakość, a 4K to zupełna nowość – przynajmniej w wybranych narzędziach.

Uwaga na haczyk: skalowanie do wyższych rozdzielczości działa tylko w Flow, Gemini API i Vertex AI. W aplikacji Gemini zostaje przy 720p. Filmy dostają też cyfrowy znak wodny SynthID, ułatwiający weryfikację, czy to AI. Google DeepMind chwali się topowymi wynikami w benchmarkach jak MovieGenBench, gdzie Veo 3.1 wygrywa pod względem jakości wizualnej i zgodności z poleceniami.

Gdzie to przetestować i co to zmienia?

Update jest już dostępne: w aplikacji Gemini na telefonie, YouTube Shorts i Create dla konsumentów, plus Flow, Google Vids, Gemini API, Vertex AI oraz Google AI Studio dla deweloperów i firm. DeepMind integruje Veo z narzędziami jak Flow do tworzenia kinematycznych historii, współpracując nawet ze studiami filmowymi.

Dla nas to krok ku światu, gdzie granica między realem a AI zaciera się na dobre. Google, z YouTube w garści, prowadzi ten taniec. Czy doczekamy dłuższych klipów czy lepszego audio? Na pewno więcej takich update’ów w 2026, na dobre i na złe. Warto zerknąć osobiście – zanim feedy zaleją nas sztucznym slopem.

Źródła: Ars Technica (https://arstechnica.com/google/2026/01/googles-updated-veo-model-can-make-vertical-videos-from-reference-images-with-4k-upscaling/), Google Blog (https://blog.google/innovation-and-ai/technology/ai/veo-3-1-ingredients-to-video), DeepMind (https://deepmind.google/models/veo), Google Blog (https://blog.google/innovation-and-ai/products/veo-updates-flow)