Regresja do Średniej w Zakładach Sportowych


Czy ponadprzeciętny występ Leicester i ekstra-niski występ Chelsea będą miały swój ciąg dalszy? Zrozumienie co oznacza odchylenie od średniej w zakładach sportowych jest kluczowe dla wszystkich systemów prognozowania opartych na przeszłych wynikach. W Premier League, sezon 2015/16 był pełen niespodzianek co skłoniło mnie do zadania pytania: czy wyjątki są długotrwałe? W tym artykule odpowiemy na to pytanie za pomocą statystyki.

Podczas pracy z systemami losowymi, zmienne, które są bardziej ekstremalne podczas pierwszego pomiaru mają tendencję do uspokojenia się nieco podczas drugiego pomiaru i wykazują mniej ekstremalne wyniki. Mówiąc prościej, jeśli weźmiemy pomiar, który jest ekstremalny w jakiś sposób, a następnie powtórzymy go ten pomiar prawdopodobnie będzie mniej ekstremalny. Zjawisko to nazywane jest regresją do średniej.

Czy Leicester wygra Premier League?

Przykładowo wyniki Leicester w pierwszej połowie sezonu 2015/16 są znacznie wyższe niż wyniki Chelsea, która w tym samym okresie jest mocno poniżej oczekiwań. Jeśli jednak wiele z wydarzeń, które przyczyniły się do osiągnięcia przez tę drużynę pozycji wynikało z czynników losowych (np. wygrana z powodu źle wykorzystanego karnego, ofsajdu itp.), zjawisko regresji oznaczałoby, że pozycja ta może nie być dla niej trwała w przyszłości.

Pomiar wydajności zespołu

Możliwym sposobem pomiaru wydajności drużyny jest porównanie rzeczywistych wyników z oczekiwaniami rynku zakładów. Na przykład, jeśli kurs na zwycięstwo wynosi 2.00, oznacza to, że rynek uważa, że drużyna ma 50% szans na wygraną (oczywiście bez wpływu marży bukmachera). Jeśli drużyna wygrywa, jest niedowartościowana w stosunku do względnych oczekiwań rynku – jeśli przegrywa, jest przewartościowana.

To podejście jest bardzo podobne do metody Brier score, która patrzy na to, jak bardzo drużyna odbiega od tego, co mówią kursy. Główna różnica polega na tym, że pozwala ona na pomiar kierunku oraz wielkości odchylenia od oczekiwań.

Przyjrzyjmy się jak Leicester i Chelsea radziły sobie w pierwszych 20 meczach sezonu 2015/16 względem oczekiwań (wypisanych kursów) u jednego z naszych bukmacherów. Każdy mecz, który drużyna wygra, otrzyma wynik skorygowany o ryzyko [1 – 1/odds], podczas gdy każdy mecz, którego nie uda się wygrać – otrzyma wynik [-1/odds].

Te wyniki są kumulowane w miarę postępu sezonu. Poniższe tabele pokazują, że Leicester radziło sobie znacznie lepiej w stosunku do rynku zakładów, podczas gdy Chelsea radziła sobie znacznie gorzej.

Pierwsze 20 meczów Chelsea

PrzeciwnikDataKursWygra/PrzegraZysk/StrataRazem zysk / strata
Swansea08.08.20151,39Przegra-0,72-0,72
Manchester City16.08.20153,87Przegra-0,26-0,98
WBA23.08.20151,65Wygra0,39-0,58
Crystal Palace29.08.20151,37Przegra-0,73-1,31
Everton12.09.20152,01Przegra-0,5-1,81
Arsenal19.09.20152,45Wygra0,59-1,22
Newcastle26.09.20151,63Przegra-0,61-1,83
Southampton03.10.20151,83Przegra-0,55-2,38
Aston Villa17.10.20151,34Wygra0,25-2,13
West Ham24.10.20152,01Przegra-0,5-2,62
Liverpool31.10.20152,07Przegra-0,48-3,11
Stoke07.11.20152,07Przegra-0,48-3,59
Norwich21.11.20151,43Wygra0,3-3,29
Tottenham29.11.20152,89Przegra-0,35-3,63
Bournemouth05.12.20151,38Przegra-0,72-4,36
Leicester14.12.20152,38Przegra-0,42-4,78
Sunderland19.12.20151,32Wygra0,24-4,54
Watford26.12.20151,52Przegra-0,66-5,19
Manchester United28.12.20152,95Przegra-0,34-5,53
Crystal Palace03.01.20162,07Wygra0,52-5,02

Pierwsze 20 meczów Leicester

PrzeciwnikDataKursWygra/PrzegraZysk/StrataRazem zysk / strata
Sunderland08.08.20151,99Wygra0,50,5
West Ham15.08.20153,42Wygra0,711,21
Tottenham22.08.20152,69Przegra-0,370,83
Bournemouth29.08.20153,57Przegra-0,280,55
Aston Villa13.09.20151,86Wygra0,461,02
Stoke19.09.20153,1Przegra-0,320,69
Arsenal26.09.20154,55Przegra-0,220,47
Norwich03.10.20153,31Wygra0,71,17
Southampton17.10.20155,1Przegra-0,20,98
Crystal Palace24.10.20152,21Wygra0,551,52
WBA31.10.20152,7Wygra0,632,15
Watford07.11.20151,88Wygra0,472,62
Newcastle21.11.20152,58Wygra0,613,23
Manchester United28.11.20153,26Przegra-0,312,93
Swansea05.12.20152,8Wygra0,643,57
Chelsea14.12.20153,11Wygra0,684,25
Everton19.12.20153,65Wygra0,734,97
Liverpool26.12.20154Przegra-0,254,72
Manchester City29.12.20154,25Przegra-0,244,49
Bournemouth02.01.20161,94Prohra-0,523,97

Remis jest uważany za „przegraną”

Jak duży wpływ na wydajność ma szczęście?

Teraz pojawia się pytanie: Czy powinniśmy oczekiwać, że świetne wyniki Leicester i słabe wyniki Chelsea (biorąc pod uwagę oczekiwania rynku) będą kontynuowane? Jeśli te wyniki są w dużej mierze spowodowane takimi czynnikami jak wysoka jakość zawodników lub dobry styl zarządzania zespołem, to możemy spodziewać się bardzo niewielkiego powrotu do oczekiwań rynkowych – przynajmniej do czasu, aż rynek zareaguje na nowy trend i ponownie oceni kursy. Z drugiej strony, jeśli te występy były w dużej mierze wynikiem szczęścia (jak np. wspomniane wcześniej błędy sędziowskie), to regresja do średniej powinna nastąpić szybko i bezproblemowo.

Aby przekonać się, jak duży wpływ ma regresja do średniej i jak na wynik meczu wpływa szczęście, należy podzielić dane na dwie połowy – pierwszą i drugą – i porównać je ze sobą. Jeśli regresja do średniej jest niewielka, można by oczekiwać, że ekstremalne wyniki w pierwszej połowie będą skorelowane z podobnie ekstremalnymi wynikami w drugiej połowie.

Oznacza to, że wydajność będzie wykazywać się wytrwałością. Alternatywnie, jeżeli regresja do średniej jest znacząca, skrajne wyniki w pierwszej połowie nie będą silnie skorelowane ze skrajnymi wynikami w drugiej połowie.

Poniższa tabela ilustruje tę zależność dla drużyn piłkarskich angielskiej Premier League w sezonach 2012/13 i 2014/15. 276 punktów pokazuje zależność pomiędzy wynikami pierwszej i drugiej połowy dla każdej z drużyn. Ciemna linia pokazuje średnią.

Korelacja wyników w pierwszej i drugiej połowie sezonu

Jak widać, korelacja praktycznie nie istnieje – regresja do średniej jest niemal idealna.

Wartość 1 oznacza doskonałą korelację, podczas gdy 0 oznacza brak korelacji w ogóle. W tej tabeli widzimy, że zmienność w pierwszej połowie sezonu jest praktycznie niezwiązana ze zmiennością w drugiej połowie sezonu, co oznacza, że nie ma związku przyczynowo-skutkowego między tymi dwoma czynnikami i że odchylenie od oczekiwań rynkowych jest zasadniczo kwestią szczęścia.

W pierwszej połowie sezonu 20 najgorzej grających drużyn miało średnią skuteczność na poziomie -4,05. W drugim sezonie drużyny te powróciły jednak do średniej -0,01, z wyjątkiem jednej drużyny, która radziła sobie jeszcze gorzej. I odwrotnie, 20 najbardziej przecenionych drużyn zanotowało średni wynik +3,71. Zniknęło to jednak całkowicie w drugiej połowie sezonu (+0,13). Ponownie, tylko jedna drużyna wykazała się w drugiej połowie sezonu jeszcze bardziej ekstremalnymi wynikami niż w pierwszej.

Być może ocena pracy zespołu w całym sezonie jest zbyt długa. W 38 meczach wiele może się wydarzyć, więc oczekiwanie jakiejkolwiek ciągłości w występach w pierwszej i drugiej połowie sezonu nie jest zbyt wygórowane.

Poza tym – jeśli poziom umiejętności danej drużyny faktycznie się zmienił, rynek zakładów zareaguje na to w drugiej połowie sezonu, więc przyszłe odchylenia od oczekiwań znów zostaną zniweczone, przynajmniej jeśli drużyna nadal będzie spisywać się równie dobrze (lub słabo) i nie wykaże się w drugiej połowie sezonu jeszcze bardziej ekstremalnymi wynikami niż w pierwszej.

Prawdopodobnie moglibyśmy zmniejszyć ten efekt poprzez włączenie do analizy mniejszej liczby gier (powiedzmy 12). Rzeczywiście, wiele jakościowych systemów przewidywania przyszłych wyników pracuje z mniejszymi okresami czasu. Niestety, korelacja pomiędzy wynikami w pierwszych 6 meczach a kolejnymi 6 meczami jest dla naszych celów naprawdę słaba.

Mądrość rynku zakładów

Jeśli pomyślimy o tym, co obecnie reprezentuje rynek zakładów, staje się niemal jasne, dlaczego szczęście jest główną siłą napędową wyników zakładów piłkarskich. Oczywiście nie chcemy tutaj sugerować, że wynik jest po prostu kwestią przypadku. Jasne jest, że drużyny takie jak Arsenal, Manchester City i Chelsea są (przez większość czasu) lepsze od drużyn takich jak Norwich, Sunderland czy Bournemouth, a ich umiejętności zwiększają prawdopodobieństwo wygranej.

Mówimy raczej, że rynek zakładów bierze pod uwagę tę różnicę w umiejętnościach drużyn, dostosowując kursy zakładów. Drużyny, które są postrzegane jako faworyci (i dlatego przypisuje się im większe szanse na wygraną) zazwyczaj przyciągają więcej graczy. Dlatego ich szanse będą niższe. Kursy działają jak swoisty handicap różnicy umiejętności pomiędzy drużynami. Ze względu na ten proces równoważenia, wyniki zależą w większym stopniu od szczęścia.

Kiedy tłum obstawiających wyraża swoją opinię na temat prawdopodobnego wyniku poprzez zakład, dość dokładna ocena prawdopodobieństwa tego wyniku często występuje w procesie, który jest bliski rozliczeniu rynkowemu (gdzie popyt obstawiających jest zrównoważony przez podaż sprzedających). Zjawisko to znane jest jako mądrość tłumów.

Kamil

Od 2002 roku interesuje się zakładami bukmacherskimi. Wtedy właśnie postawiłem swój pierwszy kupon u naziemnego bukmachera. Zainteresowanie trwa do dziś dzień i obejmuje takie zagadnienia jak statystyki, prawdopodobieństwa, różnice w dyscyplinach sportu, wpływ czynników na wyniki meczów, jak również poszukiwanie błędów w kursach bukmacherskich.

AKTUALNE POSTY