Większość korporacyjnych projektów AI ląduje w koszu, bo generyczne modele nie radzą sobie z wewnętrznym żargonem i specyficznymi procesami. Mistral wyczuł pismo nosem i wypuszcza Forge – potężne narzędzie do budowania autorskich modeli od podstaw. Zapowiedziana na konferencji Nvidia GTC nowość to otwarty strzał w stronę OpenAI i Anthropic, który ma zmienić zasady gry w sektorze enterprise.

TL;DR

  • Mistral Forge pozwala na trenowanie modeli AI od zera na unikalnych danych przedsiębiorstwa
  • Platforma zadebiutowała na Nvidia GTC z wyraźnym fokusem na sektor publiczny i biznes
  • Francuski startup celuje w ponad 1 mld USD rocznego przychodu powtarzalnego (ARR)
  • Wśród pierwszych partnerów znaleźli się giganci tacy jak Ericsson, ESA oraz ASML
  • Rozwiązanie oferuje pełną kontrolę nad modelem, wykraczając poza standardowy RAG

Ogłoszenie na Nvidia GTC i kontekst rynkowy

Mistral, francuski czempion sztucznej inteligencji, nie mógł wybrać lepszego momentu na premierę Forge niż Nvidia GTC. Tegoroczna konferencja „zielonych” kręci się wokół agentów AI dla biznesu, a Forge idealnie wpisuje się w ten krajobraz. To platforma, która umożliwia korporacjom i instytucjom rządowym tworzenie własnych modeli trenowanych na wewnętrznych bazach danych, specyficznych procesach i unikalnej wiedzy instytucjonalnej. Zamiast karmić się wyłącznie tym, co wypluł internet, firmy zyskują narzędzie do głębokiej personalizacji technologii.

Arthur Mensch, CEO Mistral, otwarcie przyznaje, że twarde stąpanie po ziemi i skupienie na klientach korporacyjnych po prostu się opłaca. Startup jest obecnie na prostej drodze do osiągnięcia ponad 1 miliarda USD rocznego przychodu powtarzalnego jeszcze w tym roku. To ciekawa ironia: podczas gdy OpenAI i Anthropic walczą o uwagę masowego użytkownika, Mistral po cichu buduje potężne imperium w segmencie B2B. Jak pisaliśmy o GTC Nvidii, wydarzenie to stało się prawdziwą kopalnią nowości dla sektora enterprise.

Jak Forge różni się od standardowych metod?

Obecnie standardem w biznesie jest tzw. dostrajanie (fine-tuning) istniejących modeli lub stosowanie generowania rozszerzonego wyszukiwaniem (RAG), gdzie dane firmy są podawane modelowi „w locie”. Problem w tym, że takie podejście nie zmienia fundamentalnej wiedzy modelu, a jedynie adaptuje go w czasie rzeczywistym. Forge idzie o krok dalej i umożliwia trenowanie od zera, co dla wielu organizacji jest świętym Graalem suwerenności technologicznej.

Dzięki takiemu podejściu systemy znacznie lepiej radzą sobie z językami innymi niż angielski, specyficzną terminologią branżową czy niestandardowymi zachowaniami. Firmy mogą budować zaawansowane systemy agentowe oparte na uczeniu przez wzmocnienie, nie martwiąc się, że dostawca nagle zmieni parametry modelu bazowego. Timothée Lacroix, współzałożyciel i CTO firmy, wyjaśnia to obrazowo:

„Kompromisy w małych modelach oznaczają, że nie są one wybitne we wszystkim, ale głęboka customizacja pozwala precyzyjnie wybrać, które cechy chcemy uwypuklić, a które możemy odpuścić”.

Taka strategia minimalizuje ryzyko uzależnienia od zewnętrznych dostawców i eliminuje przykre niespodzianki związane z wygaszaniem starszych wersji modeli (deprecjacją).

Narzędzia i wsparcie od ekspertów Mistral

Forge bazuje na sprawdzonej bibliotece modeli z otwartymi wagami, włączając w to najnowszy Mistral Small 4. Choć klienci zachowują pełną swobodę w wyborze infrastruktury, nie zostają z technologią sami – pakiet obejmuje profesjonalne doradztwo techniczne. Platforma została wyposażona w zaawansowane narzędzia do generowania danych syntetycznych oraz optymalizacji ścieżek przetwarzania informacji, co jest kluczowe przy budowie własnego stosu AI.

Elisa Salamanca, szefowa produktu, zwraca uwagę na istotny problem:

„Forge oferuje kompletną infrastrukturę do tworzenia danych syntetycznych, ale firmom często brakuje doświadczenia w rygorystycznych testach oceny – i tutaj do akcji wkraczają nasi inżynierowie wdrożeniowi (FDEs)”.

Ci specjaliści pracują ramię w ramię z zespołami klienta, co przypomina model współpracy znany z IBM czy Palantir. To właśnie inżynierowie na miejscu pomagają okiełznać chaos w danych i przekuć go w działający model.

Partnerzy i główne zastosowania

Lista partnerów korzystających z platformy już teraz robi wrażenie: Ericsson, Europejska Agencja Kosmiczna (ESA), włoskie Reply oraz singapurskie agencje DSO i HTX. Wśród wczesnych użytkowników bryluje ASML – holenderski gigant od maszyn do produkcji chipów, który we wrześniu przewodził rundzie finansowania Mistral przy wycenie rzędu 11,7 mld euro.

Marjorie Janiewicz, odpowiedzialna za przychody w firmie, wskazuje konkretne obszary zastosowań:

  • administracja publiczna – pełne dostosowanie do lokalnego języka i norm kulturowych,
  • sektor finansowy – rygorystyczne przestrzeganie zasad compliance i bezpieczeństwa,
  • przemysł produkcyjny – optymalizacja pod bardzo specyficzne potrzeby technologiczne,
  • branża tech – precyzyjne strojenie modeli pod konkretne bazy kodu źródłowego.

Są to segmenty, w których wewnętrzne dane stanowią najcenniejszy zasób, a ogólnodostępne modele często zawodzą. Warto pamiętać, że model trenowany na postach z X (Twittera) nigdy nie zrozumie zawiłości raportów finansowych czy skomplikowanych regulacji prawnych.

Strategia Mistral na rynku enterprise

Mistral stawia wszystko na jedną kartę: daje biznesowi pełną kontrolę nad danymi i systemami. W przeciwieństwie do konkurencji, która goni za chwilowym trendem konsumenckim, Francuzi cierpliwie budują lojalność wśród największych graczy rynkowych. Forge to manifest suwerenności cyfrowej – przedsiębiorstwa nie chcą być zakładnikami jednego ekosystemu, zwłaszcza gdy w grę wchodzi ich własność intelektualna.

Jak dodaje Salamanca:

„Forge pozwala przedsiębiorstwom i rządom dostosowywać modele do ich najbardziej specyficznych potrzeb”.

Przy wycenie na poziomie 13,8 mld USD i wsparciu takich gigantów jak ASML, Mistral udowadnia, że rynek enterprise to nie jest tylko dodatek do ChatGPT. Czas pokaże, czy miliard dolarów ARR to realny cel, czy jedynie pobożne życzenia – rynek zweryfikuje te ambicje szybciej, niż nam się wydaje.

Źródła:TechCrunch, VentureBeat

Najczęściej zadawane pytania