Runway, firma rozwijająca narzędzia sztucznej inteligencji do generowania wideo, zaprezentowała GWM-1, swój pierwszy tak zwany model świata. Jednocześnie spółka zapowiedziała ważne zmiany w swoim flagowym modelu wideo. Nowa technologia pozwala symulować rzeczywistość klatka po klatce, ponieważ uwzględnia prawa fizyki oraz interakcje między obiektami. Dzięki temu generowane środowiska zachowują się bliżej realnego świata niż w przypadku wcześniejszych rozwiązań.
Modele świata to systemy AI, które uczą się wewnętrznej reprezentacji otoczenia oraz zasad jego funkcjonowania. W efekcie potrafią przewidywać skutki działań, planować kolejne kroki i reagować na nowe sytuacje bez konieczności trenowania na każdej możliwej konfiguracji zdarzeń. Z tego powodu eksperci postrzegają je jako istotny krok w stronę bardziej autonomicznych i adaptacyjnych agentów sztucznej inteligencji.

Runway podkreśla, że GWM-1 wyróżnia się większą uniwersalnością niż inne dostępne modele tego typu. Co więcej, firma wskazuje, że technologia może wspierać tworzenie realistycznych symulacji wykorzystywanych między innymi w robotyce, badaniach naukowych oraz eksperymentach z zakresu nauk przyrodniczych.
Trzy odmiany GWM-1
Podczas premiery Runway zaprezentował trzy wyspecjalizowane wersje nowego modelu. Po pierwsze, GWM-Worlds umożliwia tworzenie interaktywnych scen z uwzględnieniem geometrii, oświetlenia oraz fizyki obiektów. Po drugie, GWM-Robotics koncentruje się na generowaniu syntetycznych danych treningowych, w których użytkownicy mogą zmieniać warunki środowiskowe, takie jak pogoda czy obecność przeszkód. Z kolei GWM-Avatars odpowiada za symulowanie realistycznych zachowań ludzkich awatarów.
Firma zapowiada, że w przyszłości połączy wszystkie te funkcje w jeden spójny model świata.
Gen 4.5 z natywnym dźwiękiem
Równolegle z debiutem GWM-1 Runway zaprezentował aktualizację swojego modelu wideo Gen 4.5. Najważniejszą nowością stało się dodanie natywnego audio, które umożliwia jednoczesne generowanie obrazu i dźwięku. Użytkownicy mogą tworzyć dłuższe sekwencje wideo z dialogami, dźwiękami tła oraz ujęciami z różnych perspektyw, zachowując spójność postaci i narracji.
Nowa wersja pozwala generować materiały trwające około jednej minuty, a także edytować istniejące ścieżki audio i dodawać dialogi bez korzystania z zewnętrznych narzędzi do obróbki dźwięku. Runway traktuje tę zmianę jako krok w stronę pełnoprawnych narzędzi produkcyjnych, a nie wyłącznie eksperymentalnych demonstracji możliwości AI.
Dostęp i plany współpracy
Runway udostępnia zarówno GWM-1, jak i zaktualizowany model Gen 4.5 użytkownikom płatnych planów. Firma poinformowała również, że wariant GWM-Robotics trafi do programistów poprzez zestaw narzędzi SDK. Jednocześnie Runway prowadzi rozmowy z partnerami z branży robotyki oraz przedsiębiorstwami zainteresowanymi praktycznym wykorzystaniem modeli świata w realnych projektach.
Więcej materiałów i efektów nowych modeli można znaleźć na oficjalnej stronie.
Materiał powstał we współpracy z AI: