Uczenie maszynowe definiuje nową jakość gier wideo - BPX

Wydawałoby się, że przy tworzeniu filmów animowanych albo gier wideo, komputer jest bardzo istotnym, ale tylko narzędziem w rękach człowieka. To człowiek jest artystą, który nadaje finalny kształt temu, co widzimy na ekranie, a komputer, choć towarzyszy mu na każdym kroku, jest jakby paletą barw i pędzlem. Wkrótce może się to zmienić, bo uczenie maszynowe już odgrywa rolę w produkcji wirtualnej rozrywki i robi to lepiej oraz szybciej niż człowiek. Jak dokładnie?

Do tej pory, tworząc postacie w filmach animowanych lub grach wideo, albo nadawało się modelom 3D niewidzialny kręgosłup, kości i ścięgna – aby poruszały się jak najbardziej naturalnie – albo nagrywało się aktorów w tzw. sesjach motion capture (tzw. przechwytywanie ruchu), czyli aktorów odgrywających swoje role w strojach przypominających pianki dla płetwonurków, z przyczepionymi do materiału specjalnymi markerami. Markery te zapamiętywały każde poruszenie, a potem ich odczyty były przenoszone na srebrny ekran w postaci pełnokrwistych postaci, np. błękitnoskórej rasy Na’vi z filmu „Avatar”.

Dzięki temu poruszanie się, gestykulacja, a nawet mimika twarzy tych fantastycznych stworzeń była tak realistyczna i nam – ludziom – znajoma. Albo, w grze sportowej, ruchy sportowca odtwarzającego zagrania piłką w specjalnym kombinezonie przenoszone były na ekran gry wideo, gdzie z chirurgiczną precyzją odtwarzali je zawodnicy drużyny piłki nożnej lub koszykówki, kontrolowani przez gracza lub sztuczną inteligencję.

Dziś nadal jest to standardem w branży, ale twórcy gier wideo postanowili pójść o krok dalej – w najnowszej odsłonie popularnej gry-symulacji piłki nożnej, FIFA 22, pierwsze skrzypce gra… uczenie maszynowe (inaczej samouczenie się maszyn, z ang. machine learning). W jaki sposób i dlaczego jest to przełom nie tylko dla branży wirtualnej rozrywki?

Wyobraźmy sobie, że napastnik nadciąga z piłką wprost na bramkarza w sytuacji 1:1. Obaj biegną w swoim kierunku i nagle bramkarz rzuca się na piłkę, wykonując długi wślizg, wyciągając do przodu ręce. W tym momencie, napastnik być może zdąży wykonać strzał, wykonać lob nad bramkarzem, podbić futbolówkę i podskoczyć razem z nią, albo wpaść prosto na bramkarza i stracić swoją szansę na gola. Wszystkie te możliwości mogą mieć miejsce, dodatkowe, niewymienione (np. faul, podanie), również. A jak miałoby to wyglądać w studio nagraniowym rejestrującym ruch piłkarzy? Albo ekipa musiałaby nagrać każdą taką sekwencję osobno, a potem zaimplementować ją ręcznie w grze i w zależności od decyzji gracza, taką animację uruchomić, albo… nauczyć komputer tworzyć własne, unikalne animacje, w czasie rzeczywistym, również uzależnionym od poczynań gracza.

Brzmi nierealnie? Ale już istnieje. Do tej pory wąskim gardłem w grach sportowych był fakt, że trzeba było nagrywać mnóstwo krótkich animacji, bo te długie niekiedy wypadały w akcji idiotycznie. Dlaczego? Przypuśćmy, że gracz wykonywał piłkarzem przewrotkę, ale… w tym samym momencie, w którym zdecydował się to zrobić – tracił piłkę. Niestety, animacja została już włączona i piłkarz wykonał przewrotkę jakby „na pamięć”, mimo że nie posiadał już piłki. Kopnął powietrze.

Dziś, sztuczna inteligencja odpowiedzialna za „lepienie” w całość dłuższych animacji w czasie rzeczywistym wie klatka po klatce, co może wydarzyć się za chwilę. Ponieważ we współczesnych grach sportowych mamy 60 klatek na sekundę (fpsów, z ang. frames per second), dlatego samouczenie się maszyn pozwala na edycję i wyświetlenie innej animacji 60 razy w ciągu sekundy, jeśli to konieczne.

Co więcej, jak sama nazwa wskazuje, maszyny same się uczą – czyli na podstawie wszystkich poprzednich i każdych kolejnych zagrań gracza lub komputera są w stanie w locie dobrać odpowiedniejszą (bardziej płynną, naturalną) animację ataku, obrony, zagrania, kopnięcia, rzutu, wślizgu, odegrania stałego elementu gry na boisku, itd.

Powracając do przykładu napastnika i bramkarza w sytuacji 1:1, w trakcie wślizgu bramkarza na piłkę, którą kontroluje napastnik, może dojść do wielu niespodziewanych rozwiązań akcji, szczęśliwych lub nie dla każdej z drużyn. Uczenie maszynowe dodaje 4000 nowych animacji w najnowszej odsłonie serii FIFA. Bez tak zaawansowanej technologii nie byłoby to możliwe nawet pomimo 4 lat produkcji gry. Prawdopodobnie nie przewidziano wyłącznie wbiegnięcia na boisko zbłąkanego kota lub szalonego kibica. Wszystkie inne scenariusze są prawdopodobne, tak jak w realnym meczu.

W rezultacie, co to dało? Dla graczy większe zróżnicowanie akcji i wyższy poziom realizmu, a dla developerów automatyzację procesów. Ostatecznie uczenie maszynowe zastąpiło człowieka w analizie i dobieraniu odpowiednich animacji w trakcie wirtualnego meczu. Algorytmy potrafią wybierać w locie odpowiednią animację spośród 8,7 miliona nagranych klatek. Zaoszczędziło to grupie deweloperów kilka lat żmudnej, ręcznej pracy.

Opracowanie:

Kamil Skuza

Bibliografia: