Wyobraźcie sobie, że Mark Zuckerberg po serii średnio udanych iteracji Llamy mówi „dość” i buduje zupełnie nowy fundament pod sztuczną inteligencję. Muse Spark z nowo powstałego Superintelligence Labs wchodzi na salony z hukiem – jest natywnie multimodalny, wieloagentowy i gotowy na obsługę miliardów użytkowników. Pytanie tylko, czy to faktyczny milowy krok ku superinteligencji, czy jedynie sprytny zabieg marketingowy ubrany w nowe szaty?
TL;DR
- Muse Spark to pierwszy komercyjny model z nowej rodziny Muse od Superintelligence Labs
- Innowacyjny tryb kontemplacji angażuje do kilkunastu agentów naraz dla lepszych wyników
- Model dominuje w testach: 58% w Humanity’s Last Exam i 42,8% w HealthBench Hard
- Głęboka integracja z ekosystemem Instagrama, Facebooka i Threads
- Meta zapowiada, że kolejne wersje modeli Muse zostaną udostępnione jako open source
Superintelligence Labs buduje od nowa
Meta Superintelligence Labs powołano do życia niespełna rok temu z dość skromną ambicją: dostarczenia osobistej superinteligencji każdemu mieszkańcowi planety. Zaledwie dziewięć miesięcy wystarczyło inżynierom, by od zera postawić nowy stos technologiczny – od unikalnej architektury modelu, przez optymalizację procesów, aż po rygorystyczną selekcję danych treningowych. Efekt tych prac jest co najmniej intrygujący, bo Muse Spark dowozi te same możliwości co gigantyczni poprzednicy, ale przy ponad 10 razy mniejszym zapotrzebowaniu na moc obliczeniową.
To nie przypadek, że zespół Labs postawił wszystko na efektywność energetyczną i procesową. Pamiętamy przecież, że Llama 4 Maverick przepalała gigantyczne zasoby bez oszałamiających zysków w wydajności. Teraz Meta chwali się matematycznie przewidywalnym skalowaniem, gdzie mniejsze jednostki potwierdzają założenia teoretyczne, zanim firma zainwestuje w trenowanie gigantów. Jest w tym pewna ironia: Zuckerberg, dotychczasowy król otwartego oprogramowania, tym razem stawia na model zamknięty, choć tradycyjnie obiecuje powrót do idei open source w nieokreślonej przyszłości.
W międzyczasie specjaliści z Labs intensywnie testują Muse Spark w scenariuszach z realnego świata. Mowa tu o zaawansowanym rozumowaniu wizualnym oraz skomplikowanych zadaniach z zakresu ochrony zdrowia, w których weryfikację wyników zaangażowano ponad tysiąc wykwalifikowanych lekarzy.
Introducing Muse Spark, the first in the Muse family of models developed by Meta Superintelligence Labs.
Muse Spark is a natively multimodal reasoning model with support for tool-use, visual chain of thought, and multi-agent orchestration.
Muse Spark is available today at… pic.twitter.com/qnfSzoSPzt
— AI at Meta (@AIatMeta) April 8, 2026
Pożegnanie z Llamą – multimodalna rewolucja
Muse Spark to dla Mety tzw. punkt zero – całkowicie nowy, natywnie multimodalny model rozumujący. W przeciwieństwie do swoich poprzedników, którzy byli „doklejani” do obsługi obrazu, ten system od początku integruje wizualny łańcuch myśli z narzędziami logicznymi. Podczas gdy stare Llamy skupiały się głównie na tekście, Muse Spark bez zająknięcia radzi sobie z kodowaniem wizualnym: potrafi na podstawie prostego polecenia stworzyć działającą stronę internetową lub prostą minigrę.
Model wykazuje niezwykłą sprawność w percepcji multimodalnej. Bez trudu rozpoznaje obiekty na fotografiach, precyzyjnie lokalizuje drobne elementy i analizuje skomplikowane wykresy biznesowe. Przykładowo, po otrzymaniu zdjęcia przekąsek potrafi uszeregować je pod kątem zawartości białka lub wesprzeć proces diagnostyczny na bazie obrazowania medycznego. Meta zaznacza, że to fundament pod nowe funkcje w ich produktach – od inteligentnych zakupów po stylizacje modowe inspirowane postami z aplikacji.
Zmiana kursu budzi spore kontrowersje w środowisku deweloperskim. Użytkownicy przyzwyczajeni do otwartości serii Llama mogą czuć się nieco wystawieni do wiatru, jednak Meta twardo argumentuje, że model zamknięty pozwala na znacznie szybsze skalowanie technologii w stronę prawdziwej superinteligencji.
Treści z Meta w odpowiedziach AI
Muse Spark potrafi czerpać kontekst bezpośrednio z Instagrama, Facebooka oraz Threads – co przypomina strategię, jaką obrał Elon Musk i jego Grok z platformą X. Na ten moment AI potrafi linkować do publicznych postów dotyczących konkretnych lokalizacji czy aktualnych trendów. Już wkrótce odpowiedzi będą jednak znacznie bogatsze, wplatając w konwersację Reelsy i zdjęcia, oczywiście z zachowaniem odpowiednich oznaczeń dla twórców oryginalnych treści.
Cały ten zabieg ma sprawić, by sztuczna inteligencja stała się bardziej osobista. Wyobraźcie sobie sugestie zakupowe oparte na tym, co faktycznie noszą ludzie w waszych obserwowanych społecznościach, a nie na generycznych bazach danych. Meta zapowiada, że ta funkcjonalność zostanie rozszerzona na miliony codziennych interakcji, co może całkowicie zmienić sposób, w jaki konsumujemy treści w social mediach.
Naturalnie pojawiają się pytania o prywatność, ale gigant uspokaja: system analizuje wyłącznie treści publiczne. Biorąc pod uwagę niedawne ruchy, jak choćby to, że Meta przejęła Moltbook (viralową sieć botów) czy dołączenie zespołu ManusAI, widać wyraźnie, że Zuckerberg buduje potężny ekosystem autonomicznych agentów.
Tryb kontemplacji – agentowa orkiestra
Prawdziwą gwiazdą Muse Spark jest tryb kontemplacji (Contemplating mode). To rozwiązanie, które uruchamia wiele agentów rozumujących w sposób równoległy – nawet do kilkunastu jednocześnie – i co najważniejsze, robi to bez odczuwalnego wzrostu opóźnień. Podczas gdy standardowe podejście do skalowania polega na zmuszaniu jednego agenta do dłuższego „myślenia”, tutaj postawiono na współpracę wielu jednostek, co przekłada się na drastyczny skok wydajności.
Efekt? Realna konkurencja dla najbardziej zaawansowanych trybów, takich jak Gemini Deep Think czy GPT Pro. Meta sukcesywnie wdraża to rozwiązanie na platformie meta.ai. W testach wewnętrznych system świetnie radzi sobie z wieloetapowymi zadaniami agentowymi, choć inżynierowie przyznają, że budowa systemów zdolnych do długofalowego planowania to wciąż wyzwanie, nad którym pracują.
Można odnieść wrażenie, że podejście wieloagentowe staje się nowym standardem w branży. Choć Meta nie jest pionierem tej konkretnej metody, to skala ich infrastruktury sprawia, że Muse Spark może stać się najpopularniejszym narzędziem tego typu na rynku.
To spend more test-time reasoning without drastically increasing latency, we can scale the number of parallel agents that collaborate to solve hard problems. While standard test-time scaling has a single agent think for longer, scaling Muse Spark with multi-agent thinking enables… pic.twitter.com/C4jBXGaORX
— AI at Meta (@AIatMeta) April 8, 2026
Benchmarki stawiają w czołówce
W standardowym trybie pracy Muse Spark bez kompleksów rywalizuje z modelami od OpenAI, Anthropic, Google czy xAI. W prestiżowym zestawieniu Artificial Analysis Intelligence Index model zdobył 52 punkty, co plasuje go w ścisłym top 5 – tuż za takimi potęgami jak GPT-5.4, Claude Opus 4.6 oraz Gemini 3.1 Pro. To sygnał, że Meta na poważnie wraca do walki o fotel lidera.
Szczególnie imponująco wyglądają wyniki w sektorze medycznym: 42,8% w teście HealthBench Hard pozwoliło pokonać GPT-5.4 (40,1%) oraz Gemini (20,6%). W teście rozumienia figur CharXiv model osiągnął wynik 86,4, deklasując Claude (65,3%). Z kolei w trybie kontemplacji Muse Spark wykręcił 58% w Humanity’s Last Exam oraz 38% w FrontierScience Research.
Oczywiście nie wszystko jest idealne – model wciąż ma pewne braki w zadaniach związanych z długoterminowym kodowaniem, ale Meta już zapowiada kolejne inwestycje w tym obszarze. Poniżej znajdziecie szczegółowe zestawienie wyników:
| Benchmark | Muse Spark | GPT-5.4 | Claude Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|---|
| AA Intelligence Index | 52 | >52 | >52 | >52 |
| HealthBench Hard | 42.8% | 40.1% | – | 20.6% |
| Humanity’s Last Exam | 58% | – | – | <58% |
| CharXiv figure | 86.4 | – | 65.3 | – |
Porównanie Muse Spark z liderami w kluczowych benchmarkach (dane z Artificial Analysis i Meta)
Dane pochodzące z niezależnych ewaluacji jasno pokazują, że Meta wraca do gry z produktem, który nie jest tylko kopią rozwiązań konkurencji.
Uczenie ze wzmocnieniem i kompresja myśli
Zastosowanie zaawansowanego uczenia ze wzmocnieniem (RL) w Muse Spark przynosi wymierne korzyści już po etapie pretreningu. System został zaprojektowany tak, by „karać” model za zbyt rozwlekłe procesy myślowe, co doprowadziło do zjawiska kompresji myśli. W praktyce oznacza to, że model najpierw uczy się rozwiązywać problem w dłuższym czasie, by następnie skrócić ścieżkę rozumowania bez utraty precyzji.
Analizując podzbiór zadań AIME 2025, można zaobserwować fascynującą przemianę fazową – kompresja tokenów pozwala na uzyskanie wyższej dokładności w znacznie krótszym czasie. Poprawia to ogólną niezawodność systemu, nie ograniczając przy tym kreatywności w szukaniu rozwiązań. To kluczowy element strategii skalowania.
Z perspektywy biznesowej ma to ogromne znaczenie: dostarczenie większej dawki inteligencji w przeliczeniu na pojedynczy token to czysty zysk ekonomiczny przy obsłudze miliardów zapytań, które codziennie trafiają do systemów Mety.
Bezpieczeństwo i jak zacząć?
Muse Spark został poddany rygorystycznym testom w ramach zaktualizowanego frameworka bezpiecznego skalowania Mety. Firma deklaruje, że model mieści się w bezpiecznych marginesach, wykazując dużą odporność na próby generowania treści związanych z bronią biologiczną czy zagrożeniami autonomicznymi. Zewnętrzna organizacja Apollo Research pozytywnie oceniła tzw. samoświadomość ewaluacyjną modelu.
Pełny raport Safety & Preparedness ma zostać opublikowany w najbliższym czasie. Muse Spark jest już dostępny dla użytkowników aplikacji Meta AI oraz na stronie meta.ai w dwóch trybach: Instant oraz Thinking. Deweloperzy mogą ubiegać się o dostęp do prywatnego preview API, a w nadchodzących tygodniach model trafi do WhatsAppa, Messengera oraz inteligentnych okularów.
Przyszłość rysuje się w barwach Muse – Meta planuje już większe warianty modelu i, co ciekawe, wersje open source. Priorytety firmy są jasne, o czym świadczą choćby planowane zwolnienia w Meta, mające na celu przesunięcie wszystkich środków na rozwój sztucznej inteligencji.
Źródła:
Ars Technica, ai.meta.com/blog/introducing-muse-spark-msl, about.fb.com/news/2026/04/introducing-muse-spark-meta-superintelligence-labs, TechCrunch, ArtificialAnalysis.ai, VentureBeat
