Eredivisie Kampioen Voorspelling op Basis van Data en Statistieken

Voetbalveld van bovenaf gezien met tactische lijnen en een scorebord op de achtergrond

Wie wordt kampioen van de Eredivisie? Het is de vraag die elke zomer weer opduikt en waar iedereen een mening over heeft. Pundits baseren zich op onderbuikgevoel, supporters op hoop, en de bookmakers op een mix van publieke perceptie en interne modellen. Maar er is een vierde benadering die steeds meer terrein wint: de datagedreven voorspelling. Door statistieken, historische patronen en geavanceerde modellen te combineren, ontstaat een beeld dat soms verrassend afwijkt van wat de consensus denkt.

De gedachte achter datagedreven voorspellen is niet dat cijfers de waarheid bezitten, maar dat ze patronen blootleggen die het menselijk oog mist. Een club die op basis van onderliggende statistieken beter presteert dan de ranglijst suggereert, zal op termijn stijgen. Omgekeerd zal een club die boven haar niveau presteert vroeg of laat terugvallen. Die correctie richting het gemiddelde — regressie naar het gemiddelde in statistische termen — is de kern van elke serieuze poging om het kampioenschap te voorspellen.

Expected Goals: De Hoeksteen van Moderne Analyse

Het meest gebruikte statistiekmodel in het voetbal is expected goals, afgekort als xG. Het concept is simpel: elke doelpoging krijgt een waarde toegekend op basis van de kans dat die poging resulteert in een goal. Een schot vanaf de strafschopstip heeft een xG van ongeveer 0.76, een kopbal vanaf tien meter een xG van rond de 0.10, en een afstandsschot van buiten het strafschopgebied zakt naar 0.03 tot 0.06, afhankelijk van de hoek en de positie van de verdedigers.

Door alle doelpogingen van een team in een seizoen bij elkaar op te tellen, krijg je een verwacht aantal doelpunten dat vaak afwijkt van het werkelijke aantal. Een club die structureel meer scoort dan haar xG zou suggereren, profiteert waarschijnlijk van bovengemiddeld afwerkingsgeluk of een uitzonderlijke afmaker. Dat is op korte termijn geweldig, maar op lange termijn onhoudbaar — tenzij die afmaker Erling Haaland heet, maar die speelt niet in de Eredivisie.

Voor de Eredivisie is xG bijzonder waardevol omdat de competitie een relatief klein aantal wedstrijden kent. Met 34 speelrondes is de steekproef kleiner dan in competities met meer teams, wat betekent dat toeval een grotere rol speelt. xG filtert een deel van dat toeval uit en laat zien welke clubs consequent de beste kansen creëren en het minste weggeven. In seizoenen waarin het kampioenschap pas op de laatste speeldag beslist wordt, kan het verschil tussen de werkelijke puntentotalen en de verwachte puntentotalen op basis van xG verrassend groot zijn.

Puntenprojectie en Historische Trends

Naast xG zijn er meer traditionele statistische methoden om het kampioenschap te voorspellen. Puntenprojectie is de meest directe: na een aantal speelrondes bereken je het verwachte puntentotaal door het huidige gemiddelde per wedstrijd te extrapoleren naar 34 speelrondes. Het is een grove methode, maar verrassend effectief als correctie op overenthousiaste of pessimistische verwachtingen.

De betrouwbaarheid van puntenprojectie neemt toe naarmate het seizoen vordert. Na vijf speelrondes is de voorspellende waarde beperkt — een club die vijf uit vijf wint, gaat vrijwel nooit met 102 punten kampioen worden. Maar na vijftien speelrondes is de correlatie tussen het verwachte eindtotaal en het werkelijke eindtotaal historisch gezien sterk. De meeste Eredivisie-kampioenen van de afgelopen tien seizoenen eindigden tussen de 78 en 88 punten, met uitschieters naar boven voor PSV in dominante seizoenen.

Historische trends bieden een extra laag van context. De Eredivisie is in toenemende mate een strijd geworden tussen PSV, Ajax en Feyenoord. In de afgelopen tien seizoenen wonnen deze drie clubs alle kampioenschappen — het seizoen 2019/20 werd vanwege corona niet uitgespeeld en kende geen kampioen. De laatste keer dat een club buiten de grote drie kampioen werd, was AZ in 2009 en FC Twente in 2010, wat bewijst dat een verrassing mogelijk maar uiterst zeldzaam is. Voor datamodellen betekent dit dat een prior — een startveronderstelling — die sterk leunt op de grote drie, historisch gerechtvaardigd is.

Een minder voor de hand liggende trend is het thuisvoordeel. Clubs die op natuurgras spelen in een vol stadion hebben in de Eredivisie een meetbaar groter thuisvoordeel dan clubs die in een halfleeg stadion spelen. Dat klinkt logisch, maar de omvang van het verschil is relevant voor modellen: het thuisvoordeel van Ajax in de Arena is statistisch significant groter dan het thuisvoordeel van een gemiddelde Eredivisie-club, en dat vertaalt zich over een heel seizoen in twee tot vier extra punten.

Het Model Toepassen op 2025/2026

Een datamodel voor het seizoen 2025/2026 begint met de eindstand en onderliggende statistieken van het voorgaande seizoen als basis. PSV eindigde de afgelopen jaren als een van de dominant presterende clubs, met xG-cijfers die consequent boven het competitiegemiddelde lagen. De Eindhovenaren creëren niet alleen veel kansen, maar geven er ook relatief weinig weg — een combinatie die in statistische modellen vrijwel altijd resulteert in een titelkandidatuur.

Ajax vormt de grootste bedreiging op basis van de data. De investering in de selectie vertaalt zich in verbeterde onderliggende cijfers, vooral in expected goals against — het verwachte aantal tegendoelpunten. Een club die minder kansen weggeeft, wordt op termijn beloond in de puntentelling, zelfs als de resultaten in de openingsfase van het seizoen nog niet overtuigen. De geschiedenis van de Eredivisie laat zien dat clubs die defensief sterk beginnen en offensief groeien gedurende het seizoen, vaker kampioen worden dan clubs die het omgekeerde doen.

Feyenoord is in de data een interessante casus. De Rotterdammers scoren traditioneel minder dan PSV en Ajax in termen van balbezit en doelpogingen, maar compenseren dat met een hoge efficiëntie en een sterk thuisvoordeel in De Kuip. Het model waardeert Feyenoord doorgaans als een sterke derde, met een kans op het kampioenschap die fluctueert tussen de tien en twintig procent afhankelijk van de aannames over efficiëntie en Europese belasting.

AZ, FC Twente en FC Utrecht verschijnen in datamodellen als outsiders met een gecombineerde kans van minder dan tien procent op het kampioenschap. Dat klinkt verwaarloosbaar, maar het is genoeg om interessant te zijn voor wedders die waarde zoeken bij hoge odds. Het model wijst AZ als de meest waarschijnlijke verrassing aan, voornamelijk vanwege de structureel goede jeugdopleiding en het vermogen om boven het budget te presteren.

Waar de Data Afwijkt van de Bookmakers

Het fascinerende aan datagedreven voorspellingen is dat ze regelmatig afwijken van de bookmaker-odds, en juist in die afwijking schuilt de potentiële waarde voor wedders. Bookmakers stellen hun odds niet uitsluitend op basis van modellen vast — ze houden ook rekening met publieke perceptie, inzetpatronen en commerciële overwegingen. Als een grote groep wedders op PSV inzet, verlagen de bookmakers de PSV-odds om hun risico te spreiden, ongeacht wat het onderliggende model zegt.

Data-modellen hebben die commerciële prikkel niet. Ze geven een inschatting op basis van de cijfers, punt. Als het model Ajax op 30 procent kans op het kampioenschap zet en de bookmaker-odds een impliciete kans van 22 procent weerspiegelen, is er potentieel waarde in een weddenschap op Ajax. Het verschil tussen de modelkans en de impliciete bookmaker-kans is de edge die datagedreven wedders zoeken.

Maar voorzichtigheid is geboden. Elk model heeft beperkingen. xG houdt geen rekening met blessures van sleutelspelers, trainersontslagen, of de psychologische druk van een titelrace. Een model dat PSV als favoriet aanwijst, kan niet voorzien dat de sterspeler in oktober zijn kruisband scheurt. Daarom gebruiken serieuze analisten modellen als startpunt, niet als eindoordeel. De data geeft richting, maar het zijn de zachte factoren — ervaring, mentaliteit, geluk — die uiteindelijk bepalen wie in mei de schaal omhooghoudt.

De Transfermarkt als Variabele

Een factor die elk statistisch model voor de Eredivisie compliceert, is de transfermarkt. De Nederlandse competitie is van oudsher een opleidingscompetitie: toptalenten worden ontwikkeld en na een of twee sterke seizoenen verkocht aan clubs in de Premier League, La Liga of de Bundesliga. Dat betekent dat de selectie waarmee een club het seizoen begint, er in januari anders uit kan zien na een of twee uitgaande transfers.

Voor modellen is dit een terugkerend probleem. De xG-cijfers van de eerste seizoenshelft zijn gebaseerd op een selectie die in de tweede helft niet meer bestaat. Een club die haar topscorer in de winterse transferperiode verliest, ziet haar verwachte doelpuntenproductie dalen, maar dat effect zit niet automatisch in het model. Wedders die met data werken, moeten daarom altijd de transferperiode in de gaten houden en hun inschatting bijstellen wanneer er significante veranderingen in de selectie plaatsvinden.

Dit maakt de Eredivisie tegelijkertijd uniek en uitdagend voor datagedreven analyse. In competities waar de selecties stabieler zijn — de Premier League, met haar financiële slagkracht om spelers vast te houden — zijn seizoensmodellen betrouwbaarder. In de Eredivisie is elk model per definitie een momentopname, en de beste voorspellers zijn degenen die bereid zijn om hun model continu bij te stellen op basis van nieuwe informatie. Dat vereist discipline, tijd en de bereidheid om een eerder ingenomen positie los te laten als de data een ander verhaal vertelt.