Talent to liczby, czyli zastosowanie data science w sporcie - BPX

Czy można na podstawie statystyk zbudować idealny zespół baseballowy, piłki nożnej, albo koszykówki? Idealny – nie. Ale wygrywający mecz za meczem – tak. Jak to zrobić? Potrzeba niewiele, wystarczy odpowiednie wprowadzenie, przetworzenie i wizualizacja danych.

Kompletując drużynę do baseballa, łowcy talentów, tzw. „skauci”, managerowie i trenerzy głównie upatrują w graczach:

  • Średniej ilości uderzeń (pałkarzy)
  • Jakości tych uderzeń*
  • Liczbie asyst ofensywnych**
  • Skradzionych baz

Billy Beane, główny manager amerykańskiego zespołu Oakland’s Athletics, w 2001 roku, zmienił podejście do baseballu, którego to przedstawiciele sportu kurczowo trzymali się swojej strategii tworzenia drużyn od prawie 150 lat.

Billy skonstruował nowy model dream teamu, skupiając się na takich czynnikach jak:

  • Uderzenia (ilość zdobytych baz podzielona przez ilość możliwych uderzeń)
  • Procent zdobycia bazy (zależna od różnych zmiennych takich jak siła uderzenia, błędy obrony, wybory obrońców, przeszkadzanie łapacza)

Skąd tak drastyczna zmiana myślenia i autorskie podejście do najsilniej zakorzenionego w USA sportu?

Po pierwsze, jeśli nie wiadomo o co chodzi – chodzi o pieniądze. Zespół Oakland’s Athletics miał około 3-krotnie mniejszy budżet od niepokonanych Jankesów z Nowego Jorku (40 mln$ kontra 120 mln$), więc nie mógł sobie pozwolić na nonszalanckie zakupy najpopularniejszych graczy z ligi.

Po drugie, w czasie swoich wojaży po innych drużynach, w trakcie negocjacji transferu zawodników, poznał niepozornego Petera Branda, który w kuluarach powiedział, że jego zdaniem podejście decyzyjnych managerów w baseballu jest od dziesiątek lat błędne. Wtedy wypowiedział kultowe dziś słowa: „Twoim celem nie powinno być kupowanie graczy. Twoim celem powinno być kupowanie zwycięstw. Aby kupować zwycięstwa musisz kupować przebiegi” [run = zdobycie punktu].

Na drugi dzień Bill zatrudnił Petera, którzy razem zasiedli do autorskiego oprogramowania Petera, służącego do analizy olbrzymiej ilości danych. Oraz, co równie ważne, do wizualizacji tych danych, które były niemal bezużyteczne bez odpowiedniej obróbki i przygotowania.

Wyobraźmy sobie 162 mecze w sezonie, w którym ściera się ze sobą łącznie 30 drużyn po 25 graczy:
162 x 30 x 25 = 121.500

Daje nam to minimum 121.500 istotnych do analizy liczb i statystyk (punkty, bazy, faule, wybicia, uderzenia, itp.) w sezonie. Wyłącznie przy teoretycznym założeniu, że każdy gracz tylko raz wykona rzut, raz uderzy piłkę, raz dobiegnie do bazy, itd. Zatem w praktyce danych do pozyskania z jednego sezonu jest znacznie więcej. Peter musiał dodatkowo wziąć także pod uwagę przynajmniej kilka ostatnich sezonów, ponieważ spora część graczy nadal była aktywna w lidze.

Statystyk musiał więc wprowadzić ogromną ilość danych (miliony wierszy), dokonać ekstrakcji tych najważniejszych i dodatkowo przedstawić je w taki graficzny sposób, żeby Billy zrozumiał jego tok rozumowania i strategiczne założenia budowania nowej drużyny na nadchodzący sezon.

Peter dostrzegł, że cała liga baseballowa kieruje się głównie kupowaniem graczy, którzy mają wysoką średnią uderzeń i wysoki współczynnik home run. Jego zdaniem – jak się okazało, słusznie – wystarczyło skupić się na graczach, którzy mają wysoki współczynnik zdobywania baz, po prostu. Takich graczy było więcej na rynku i byli dużo tańsi. Co więcej, można było jeszcze popracować nad ich umiejętnościami zwiększając skuteczność w zdobywaniu baz.

Efekt? Oakland’s Athletics zostało pierwszą drużyną w historii baseballu, która wygrała 20 meczy z rzędu, bez ani jednej porażki. Drużyna zdobyła również 4 tytuły American League West.

Co ciekawe:

  • Dane graczy amerykańskiej ligi baseballowej były ogólnodostępne od 1960 roku, ale nikt nie korzystał z nich w odpowiedni sposób.
  • W Indiach, w krykiecie, każda drużyna posiada swojego analityka od tzw. „analityki efektywności” graczy opierającej się na 4 głównych danych.
  • W NBA, w 2008 roku, z analizy danych korzystało 5 drużyn. Od 2016 roku każda 30. drużyn zatrudnia na stałe analityków danych.
  • E-sport od początku istnienia korzysta z analizy danych do szczegółowego wglądu w najsilniejsze i najsłabsze strony zawodników, ich zachowania i czas reakcji w konkretnych sytuacjach, miejscach i pozycjach, w których najlepiej i najgorzej sobie radzą.

Najważniejszy jednak morał jest następujący: Peter miał niebywałe umiejętności programistyczne, statystyczne, oraz wysokorozwinięte myślenie matematyczne i logiczne, a wraz z Billym – biznesowe. Dziś, aby dokonać takiej (lub mniejszej, ale wciąż efektywnej i lukratywnej) zmiany, nie trzeba być alfą i omegą statystyki. Wystarczy odpowiednie oprogramowanie i ludzie, którzy płynnie się w nim poruszają. Takie jak narzędzia do Business Intelligence, które mają za zadanie z użytkowników biznesowych zrobić „mistrzów danych”.

Dowiedz się więcej o narzędziach do data science: https://www.bpxglobal.com/solution/altair/altair-knowledge-studio/

*np. poza boisko pozwalających na tzw. home run czyli zaliczenie wszystkich baz i zdobycie punktu

**cecha statystyczna przypisywana pałkarzowi, równa ilości obiegów zdobytych przez zawodnika po uderzeniu piłki przez pałkarza

Napisz do nas i dowiedz się więcej o narzędziach do Business Intelligence i Data Science! bpx@bpx.pl

 

Autor:

Kamil Skuza

Bibliografia:

Poprzedni wpis: Data science i karaoke, czyli jak analizowało się dane pół wieku temu?

Kontakt z Nami

W czym możemy Ci pomóc?

Wypełnij poniższe pola i wyślij formularz - odpowiemy niezwłocznie