vrijdag 10 juni 2016

28 punten voorsprong? Puur toeval!

In een vol voetbalstadion heeft zojuist het laatste fluitsignaal geklonken. Nadat 22 spelers zich 90 minuten lang in het zweet gewerkt hebben is er een eindstand van 1-0 op het scorebord gekomen. Dit is niet zonder slag of stoot gegaan: zo zag de scheidsrechter een handsbal over het hoofd, waardoor de uitploeg een strafschop ontnomen werd. Ook bleef een elleboogstoot van een speler van de thuisploeg buiten het oog van de arbitrage, en tot overmaat van ramp ketsten ook nog twee schoten van de bezoekers af tegen de lat. De coach van de uitploeg staat dan ook met een nogal zuur gezicht bij de microfoon van de tv-verslaggever. "Het zat ons niet mee vandaag," zegt de oefenmeester, "maar aan het eind van het seizoen staat iedereen op de positie waar hij moet staan."

De gedachte dat geluk en pech elkaar uiteindelijk opheffen is wijdverbreid. De achterliggende gedachte is vaak: een heel seizoen lang vrijwel wekelijks een wedstrijd spelen, dat zal toch wel genoeg zijn om op de meest verdiende positie uit te komen? Maar in de praktijk zijn de verschillen aan het eind van het seizoen vaak nog zo klein dat één verloren wedstrijd het verschil kan maken tussen wel of geen kampioenschap. Het ligt daarom voor de hand dat het toeval nog steeds een rol speelt na 34 wedstrijden. Om erachter te komen hoe groot de invloed van het toeval is, is er maar één goede methode: alle vormen van verschillen in teamkwaliteit opheffen en resultaten enkel en alleen door toeval bepalen.

In de echte wereld bestaan er natuurlijk altijd kwaliteitsverschillen tussen teams, dus zullen we een weg moeten vinden om seizoenen virtueel te simuleren. Dit doen we met behulp van de Poissonverdeling. Deze verdeling wordt gebruikt voor gebeurtenissen die in een bepaald tijdsinterval gemiddeld een bepaald aantal keer voorkomt, maar waarvan onvoorspelbaar is wanneer ze gebeuren. De gebeurtenissen waar we de Poissonverdeling voor gaan gebruiken, zijn (uiteraard) doelpunten. Als we weten hoe vaak een goal gemiddeld voorkomt, kunnen we met behulp van de verdeling uitrekenen hoe groot de kans is dat een bepaald aantal doelpunten valt. Het gemiddelde aantal doelpunten per wedstrijd (voor beide teams) waar we vanuit gaan is gemiddelde aantal doelpunten per wedstrijd in het Eredivisie-seizoen 2014-2015: 3,08. Daarnaast wordt nog rekening gehouden met een thuisvoordeel: thuisploegen maken in de simulatie gemiddeld 14% meer treffers dan gemiddeld, uitploegen 14% minder. Dit levert de volgende kansen op:


Deze kansen gebruiken we om in een competitie met 18 teams alle 306 wedstrijden te simuleren en een eindstand op te maken. Door deze simulatie 5000 keer uit te voeren, kunnen we erachter komen hoe groot de verschillen door puur toeval kunnen worden. Elke simulatie berekenen we het verschil tussen de nummer 1 en de nummer 18 en daarmee komen we tot het volgende histogram:
Het blijkt dat de puntenverschillen flink op kunnen lopen. Gemiddeld is het verschil tussen de nummer 1 en de nummer 18 28 punten - niet bepaald een verschil waarvan de meeste mensen zullen vermoeden dat het door enkel toeval veroorzaakt wordt.

Dit is echter het meest extreme verschil dat per simulatie voorkomt; als we willen weten hoe groot de verschillen gemiddeld worden, is het beter om de standaardafwijking uit te rekenen. De standaardafwijking van de puntenaantallen van alle clubs is per simulatie gemiddeld 8 punten. Als jouw ploeg 8 punten hoger op de ranglijst staat dan een andere ploeg, zul je er vast van overtuigd zijn dat je iets beter doet dan die concurrent. Maar hieruit blijkt dat 8 punten een heel normaal verschil is tussen twee ploegen die exact even goed zijn.

Wat is nou de les die we uit deze analyse moeten trekken? In ieder geval beseffen dat toeval ook op lange termijn nog een significante rol speelt in het voetbal en dat de stand lang niet altijd een volledig getrouwe weergave is van de kwaliteiten van de teams. De nummer 1 zal wel beter zijn dan de nummer 18, maar kleinere verschillen kunnen makkelijk door toeval veroorzaakt worden. Dit is ook een aanmoediging om andere manieren dan de stand te zoeken om erachter te komen wat de werkelijke kwaliteit van ploegen is: bijvoorbeeld kijken hoeveel en hoe grote kansen een ploeg creëert en incasseert. De bal is rond en voetbal is een complexe sport. Laten we juist daarom data in het voetbal omarmen.

Geen opmerkingen:

Een reactie posten