Model Symulacji „Monte Carlo” do Przewidywania Wyników


Jakich modeli używasz, by określić na które typy postawić? Jeśli jeszcze nie słyszałeś o modelu symulacji Monte Carlo, to właśnie go poznasz.

Istnieje wiele sposobów na numeryczne rozwiązywanie codziennych problemów. Zazwyczaj jednak używamy bardziej tradycyjnego środka – funkcji.

Dziś jednak będzie inaczej. W tym artykule jako przykład posłużymy się głównie wyścigami Formuły 1, a konkretnie przypadkami z zeszłego sezonu o zajmiemy się modelami matematycznymi.

Załóżmy, że chcemy obliczyć prawdopodobieństwo wygrania przez Lewisa Hamiltona Grand Prix Japonii. Możemy zbudować funkcję, w której umieścimy parametry, które wpływają na wydajność (na przykład, wyniki ostatniego wyścigu, jakość techniczna samochodu, i tak dalej). Podobną strategię możemy zastosować w piłce nożnej, gdzie analiza Poissona jest często wykorzystywana do szacowania liczby zdobytych bramek.

Ale co by było, gdyby obstawiający chcieli obliczyć prawdopodobieństwo, że Hamilton wygra cały sezon Formuły 1? Wymagane obliczenia byłyby nieporównywalnie bardziej złożone i z pewnością nie wystarczyłaby tylko jedna funkcja matematyczna. W tym miejscu z pomocą przychodzą modele matematyczne.

Model deterministyczny

Model deterministyczny jest podobny do klasycznej funkcji. Możemy łatwo obliczyć wynik, gdy znamy wszystkie niezbędne informacje wejściowe. Gdybyśmy jednak chcieli obliczyć szanse Hamiltona na zdobycie tytułu przed Grand Prix Japonii, potrzebowalibyśmy bardziej technicznego i skomplikowanego podejścia.

Model stochastyczny

Jednym ze sposobów na to może być symulacja wyników pozostałych pięciu Grand Prix (Japonia, Rosja, USA, Brazylia, Abu Dhabi) poprzez model symulacji Monte Carlo. Jest to technika, która wykorzystuje losowo wygenerowane liczby do oszacowania wyniku. Jest to model stochastyczny, w którym mamy wiele zmiennych losowych – a nie jedną prostą funkcję – i musimy uzyskać rozrzut wyników.

W tamtym momencie szanse trzech czołowych kierowców na zdobycie tytułu były następujące:

  • Hamilton (1.568)
  • Rosberg (2.510)
  • Ricciardo (51.240 – w tym momencie był już 60 punktów za Hamiltonem, więc jego szanse na tytuł były czysto teoretyczne).

Z technicznego punktu widzenia szósty Valtteri Bottas również miał teoretyczną szansę na tytuł, ponieważ do zdobycia było jeszcze w sumie 150 punktów, ale dla uproszczenia naszego modelowego przykładu przyjmiemy, że tylko trzech najlepszych kierowców miało szansę wygrać.

Gracze powinni więc symulować wszystkie pozycje z pierwszej dziesiątki, czyli te, za które kierowcy otrzymują najwięcej punktów. Jednak w tym artykule zasymulujemy tylko zwycięzcę wyścigu i drugie miejsce.

Jeśli którykolwiek z tych trzech kierowców nie ukończy wyścigu na dwóch pierwszych pozycjach automatycznie przyjmiemy, że otrzyma 6 punktów, co jest zbliżone do średniej punktów, jakie otrzymałby, gdyby przekroczył linię mety między trzecim (15 punktów) a jedenastym miejscem (0 punktów). Przykładowo, jeśli Hamilton zajmie pierwsze miejsce (25 punktów), a Rosberg drugie (18 punktów) to w symulacji Ricciardo otrzyma 6 punktów.

Rosberg, Hamilton i Ricciardo wygrali 4, 7 i 3 z 14 Grand Prix, które odbyły się do tego momentu w sezonie 2014. Możemy więc zastosować stosunek siły 4:7:3:1 dla Rosberg x Hamilton x Ricciardo x Inni.

W tym przypadku mamy 13 możliwych wyników (oznaczonych literami od A do M) dla każdego wyścigu. Na przykład, w przypadku wyniku I – patrz tabela poniżej – Ricciardo wygrywa wyścig, a żaden z kierowców Mercedesa nie zajmuje drugiego miejsca. Prawdopodobieństwo, że Ricciardo wygra wyścig wynosi 3/15, ponieważ nasz stosunek siły wynosi 4:7:3:1, podczas gdy prawdopodobieństwo, że ani Hamilton, ani Rosberg nie ukończą wyścigu na drugim miejscu wynosi 1/12, ponieważ teraz musimy wykluczyć Ricciardo z stosunku sił.

Zatem prawdopodobieństwo, że Ricciardo zdobędzie 25 punktów, a pozostali dwaj kierowcy po 6 punktów wynosi 3/15*1/12 = 1/60. Prawdopodobieństwo każdego wyniku jest podane w poniższej tabeli. Jednocześnie zawsze podawane jest prawdopodobieństwo kumulatywne.

WynikiABCDEFGHIJKLM
Rosberg2525251866186618666
Hamilton1866252525618661866
Ricciardo6186618625252566186
Prawdopodobieństwo17,00%7,30%2,40%23,30%17,50%5,80%6,70%11,70%1,70%1,80%3,10%1,30%0,40%
Prawdopodobieństwo łączne17,00%24,20%26,70%50,00%67,50%73,30%80,00%91,70%93,30%95,10%98,20%99,60%100%

Wartości skumulowane mogą być następnie wykorzystane do oszacowania wyników. W danym momencie do końca roku pozostało 5 wyścigów, więc możemy wygenerować 5 liczb losowych z przedziału od zera do jednego (można do tego celu użyć np. programu Microsoft Excel).

Dla każdej wartości używamy arkusza kalkulacyjnego, aby oszacować liczbę punktów zdobytych przez trzech kierowców. Na przykład jeśli pierwszą liczbą losową jest 0,4125 (liczba leżąca pomiędzy 26,7% a 50,0%), zasymulowalibyśmy wynik D dla wyścigu w Japonii – Hamilton zająłby pierwsze miejsce, a Rosberg drugie.

W każdej symulacji dodawaliśmy punkty aktualnego kierowcy do punktów zdobytych w naszych pięciu symulacjach. Zwycięzcą zostanie kierowca, który zdobędzie najwięcej punktów.

Powinieneś powtórzyć ten proces w dużej liczbie symulacji, aby upewnić się, że próbka statystyczna nie jest zbyt mała. Na przykład, jeśli Hamilton wygra 4,000 razy na 10,000 symulacji jego szansa na zdobycie mistrzostwa wynosi 0.4 lub 40%.

Modelowanie dynamiczne

Modelowanie dynamiczne to sposób modelowania, w którym poszczególne parametry są dopracowywane w trakcie symulacji.

W tym przypadku układ sił zmieniałby się po każdym symulowanym wyścigu. Zmiany będą odzwierciedlone w różnych zmiennych, takich jak forma, moment obrotowy, ustawienia samochodu i tak dalej.

Na przykład, jeśli model przewiduje, że Hamilton wygra Grand Prix Japonii, system może wziąć pod uwagę momentum w następnym wyścigu w Rosji. Dodatkowo, stosunek momentum dla Grand Prix Rosji zmieniłby się na 4:8:3:1.

Podsumowanie

Jak widać modele matematyczne mają trzy główne fazy – deterministyczną, stochastyczną i dynamiczną. Im wyższa faza, tym większa wiedza techniczna jest potrzebna. Model symulacyjny Monte Carlo może być wykorzystany w dwóch ostatnich fazach, przy czym kluczową różnicą jest to, że uczy się on na podstawie własnych symulacji.

W rezultacie, model oparty na rozkładzie prawdopodobieństwa nie da ostatecznej odpowiedzi, takiej jak przeczucie. Zamiast tego, odpowiedzią modelu jest sam rozkład prawdopodobieństwa, który przedstawia zakres prawdopodobnych wyników i ich konkretne prawdopodobieństwa.

Należy jednak wziąć pod uwagę, że wszystkie modele matematyczne mają swoje słabe strony, a model symulacji Monte Carlo nie jest pod tym względem inny. To zależy od tego, jak dokładne są dane wejściowe, które wprowadzasz do systemu. Upewnij się więc, że pracujesz w oparciu o dobre informacje.

Jeśli chcesz z powodzeniem używać modeli matematycznych do określania prawdopodobieństwa wyników różnych wydarzeń sportowych, będziesz musiał je testować i udoskonalać przez długi czas. Oczywiście proces ten należy stosować w połączeniu z wyważoną strategią zakładów – nie należy polegać na modelach matematycznych jako zbawieniu.

Kamil

Od 2002 roku interesuje się zakładami bukmacherskimi. Wtedy właśnie postawiłem swój pierwszy kupon u naziemnego bukmachera. Zainteresowanie trwa do dziś dzień i obejmuje takie zagadnienia jak statystyki, prawdopodobieństwa, różnice w dyscyplinach sportu, wpływ czynników na wyniki meczów, jak również poszukiwanie błędów w kursach bukmacherskich.

AKTUALNE POSTY