De val van de lotto

20 december 2013 door DH

Het resultaat van de Lotto-trekking wordt bepaald door zeven genummerde balletjes, die telkens volgens dezelfde procedure in draaiende trommels vallen. Maar een wiskundige berekening levert resultaten op die twijfel doen zaaien. Is het Lotto-mechanisme wel perfect willekeurig?

Het resultaat van de Lotto-trekking wordt bepaald door zeven genummerde balletjes, die telkens volgens dezelfde procedure in draaiende trommels vallen. Maar een wiskundige berekening levert resultaten op die twijfel doen zaaien. Is het Lotto-mechanisme wel perfect willekeurig?

Van 1978 tot 1983 werd het resultaat van Lotto bepaald door zeven getallen van 1 tot en met 40. Daarna voerde de Nationale Loterij het totale aantal op tot 42, en sinds oktober 2011 is dat 45. De uitverkoren nummers worden steeds afgelezen op balletjes die volgens een bepaalde procedure in draaiende trommels vallen. Die trommels zijn al een paar keer vernieuwd. Zo werd tussen 1993 en 2005 een trommel gebruikt die insiders ‘de diamant’ noemden. Het aantal ballen bleef echter gelijk, en sinds 2005 werkt Lotto zowel in het geval van 42 als van 45 getallen met dezelfde trommel, en met tien ‘kolommen’ waar de balletjes uit vallen.

Maar het is algemeen bekend dat balletjes in bijvoorbeeld een grid-structuur niet zomaar naar beneden vallen. Als er een driehoekig patroon is dat de balletjes belet rechtdoor te vallen, vormen die uiteindelijk een zogenoemde ‘binomiale distributie’. Ze liggen dus niet zomaar in een willekeurig hoopje op elkaar. Hoe zou dat dan zitten met de verdelingscurve voor de balletjes die door het mechanisme van Lotto vallen?

Onze intuïtie beeldt zich moeilijk in hoeveel keer een getal kan verschijnen of wegblijven in een willekeurige rij

Wanneer de Lottotrekking begint, vallen de balletjes vrijwel simultaan door gaten in een trommel. Wil dat zeggen dat ze ook op een willekeurige manier de bodem van de trommel bereiken? Als we een vergelijking maken met rijen mensen die zich door een deur wringen, valt het op dat een bepaalde rij – links, rechts of in het midden – wel eens geplet wordt door een andere. Het is dus allesbehalve zeker dat het valmechanisme van Lotto zo willekeurig is als het lijkt.

Daarna doet een draaibeweging in de trommel de balletjes schijnbaar willekeurig bewegen en rondspringen. En daarom zou het resultaat van Lotto niet te voorspellen zijn. Toch kunnen we ons inbeelden dat een superkrachtige computer, geprogrammeerd volgens de klassieke natuurkundige wetten, een en ander kan modelleren en er in die trommelbewegingen dus weinig sprake is van toeval. Tot slot is er natuurlijk ook een ‘onschuldige’ hand, die bepaalt wanneer een balletje geselecteerd wordt. Maar die hand wacht nooit erg lang, en drukt anderzijds ook nooit heel snel af. Dus, als het mechanisme en de beginvoorwaarden altijd gelijk zijn, zou de statistiek dan niet de overige toevalsfactoren kunnen uitsluiten? Zouden we niet een of andere wetmatigheid kunnen ontwaren? We nemen de proef op de som.

‘Iets’ aan de hand

Op de website van Lotto staat een overzicht van alle uitgelote getallen. Hoewel het mechanisme in 1993 en in 2005 veranderde, worden alle gegevens op één hoop gegooid. Maar er is ook een gedetailleerder archief voorhanden, waar we gegevens kunnen selecteren volgens datum. Zo brengen we enerzijds de resultaten bij elkaar tussen 2006 en 2011, en anderzijds die vanaf 2011. Omdat we niet precies weten wanneer er in 2005 een nieuwe trommel in gebruik werd genomen, werken we veiligheidshalve met de resultaten tussen 1 januari 2006 en 30 september 2011, en van 1 oktober 2011 tot vandaag.

De tabel ‘Hoe vaak blijft een nummer uit?’ geeft het aantal trekkingen, en dus het aantal weken, sinds een getal voor de laatste keer uitgeloot werd. De ballen die getrokken werden op de dag dat de statistiek gemaakt werd, krijgen dus het cijfer 0. De tabel is geordend volgens de plaats waar de genummerde balletjes liggen in de startpositie van de Lottotrekking. Onder elke kolom staat het gemiddelde van die kolom. De maxima (rood) en de minima (groen) schijnen aan te geven dat er vóór 2011 ‘iets’ aan de hand was met de linkerzijde van het mechanisme, terwijl na 2011 het rechtergedeelte verrassend overkomt.

Daarnaast gieten we nog een ander statistisch Lottogegeven in een tabel: hoe vaak werd een nummer uitgeloot in de onderzochte periode? Per kolom berekenen we het totaal; de rij daaronder geeft de verwachte waarde aan. Die volgt tussen 2006 en 2011 uit het totaal van 4.193 (599 trekkingsdagen maal 7 getallen) gedeeld door 42 balletjes. Die uitkomst – 99,83 – vermenigvuldigen we naar gelang van de kolom met 5, wat 499,2 geeft, of met 4, wat 399,3 geeft. Na 2011 is het totaal aantal ballen 1.379 (197 trekkingsdagen maal 7 getallen). Gedeeld door 45 maakt dat 30,644, wat voor kolommen met 5 ballen een verwachte waarde van 153,22 geeft en voor de kolommen met 4 ballen een waarde van 122,58. Opvallende kanttekening: hoewel we voor de eerste periode ongeveer vier keer meer cijfers hebben dan voor de tweede periode, zijn beide periodes statistisch gezien even relevant. In beide gevallen berekenden we vervolgens de afwijking van het reële aantal ten opzichte van het verwachte aantal en zetten dat om in een percentage. Voor beide periodes zijn die cijfers opvallend in de rechterzijde van de tabel: een verschil van -15 procent en +8 procent (samengeteld 23 procent) voor 2011, en een verschil van -20 procent en +15 procent (maar liefst 35 procent!) na 2011. Maar zijn die cijfers voldoende om er volgens de statistische werkwijze besluiten uit te trekken?

De intuïtie misleidt

Om dat te weten te komen, gaan we te rade bij professor David Vyncke van de Universiteit Gent, Vakgroep Toegepaste Wiskunde, Informatica en Statistiek. Met zijn Onderzoeksgroep Stochastische Modellering doet hij onderzoek naar risicobeheersing in onder meer de financiële sector. ‘Uit het aantal weken dat een Lottoballetje niet wordt getrokken, kan je moeilijk conclusies trekken’, zo stelt hij. ‘Kijk maar naar de zogenoemde paradox van de ‘longest run’. Die stelt dat de menselijke intuïtie het moeilijk heeft om zich in te beelden hoeveel keer een bepaald getal kan verschijnen of wegblijven in een rij willekeurige getallen. Zo is de langste reeks niet-6-worpen in een willekeurige rij van 200 worpen met een dobbelsteen gemiddeld zo’n 22 worpen lang. Intuïtief lijkt dat erg verrassend, maar op statistisch vlak is het dat hoegenaamd niet.‘

Als het Lotto-mechanisme willekeurig zou werken, is er slechts tien procent kans op deze afwijkingen

De Hongaar Tamás Varga stelde een experiment op om onze foute intuïtie te illustreren. Hij deelde een klas op in twee groepen en gaf elke leerling de opdracht om op een papiertje een rij van tweehonderd keer kop of munt te noteren. De leerlingen uit de ene groep moesten daarvoor tweehonderd keer een muntstuk opgooien en het resultaat noteren, de leerlingen uit de andere groep moesten hun verbeelding gebruiken en zelf een ‘willekeurige’ rij verzinnen. Achteraf werden alle papiertjes verzameld en probeerde Varga ze een voor een aan de juiste groep te koppelen. Voor de meeste papiertjes slaagde hij daar ook in, want het volstond om te tellen hoeveel keer een leerling maximaal na elkaar kop had geschreven. In een echt willekeurige rij van 200 is die ‘longest run’ gemiddeld zo’n 7 tekens lang, en in 95 procent van zulke rijen zal de ‘longest run’ minstens 5 keer kop zijn. Maar een leerling die zelf een rij moet verzinnen, zal zelden meer dan 4 keer op rij kop noteren. Het aantal weken dat het trekken van een nummer bij de lotto uitblijft, levert dus conclusies op die onze intuïtie snel kunnen misleiden.

Laten we ons daarom liever richten op het aantal keer dat een getal getrokken wordt. Dat resulteerde zowel bij het valmechanisme van vóór 2011 als bij dat van na 2011 in een gevecht tussen de rechterballetjes. Het idee om de ballen per kolom te bestuderen, vindt professor Vyncke zeer interessant. Die werkwijze levert volgens hem op het eerste gezicht opvallende resultaten op. ‘We gebruiken daarvoor een klassieke statistische methode om na te gaan of een bepaalde afwijking aan het toeval te wijten is: de chi-kwadraattoets. Die proef maakt een globale vergelijking van geobserveerde frequenties met de verwachte frequenties in elke kolom.’ Vyncke voerde zo’n chi-kwadraattoets uit op onze gegevens. Voor de situatie van 2006 tot 2011, waar we een verschil van 23 procent opmerkten, bekomt hij een p-waarde van 0,10. Bij de recentere gegevens, met een verschil van 35 procent, bedraagt de p-waarde 0,45.

Die afwijking van 0,45 is niet zo uitzonderlijk, want ze betekent, eenvoudig gesteld, dat zelfs als het Lottomechanisme volledig correct willekeurig zou werken, er toch nog 45 procent kans is op een dergelijke globale afwijking. In het eerste geval is die kans echter maar 10 procent, al is dat voor een statisticus nog altijd geen reden om te twijfelen. Pas als de kans minder dan 5 procent bedraagt, verwerpt een statisticus de veronderstelling van een perfect willekeurig mechanisme.

Een statistisch geval?

Er is natuurlijk nog een factor die de trekking beïnvloedt, namelijk de ‘onschuldige hand’. Misschien moeten we, om eenvoudig te beginnen, statistische tests uitvoeren met een stilstaande Lottotrommel. De balletjes vallen dan gewoon in de trommel vanuit dezelfde beginpositie. Zouden er, zoals bij de binomiaalverdeling, wetmatigheden optreden, als steeds op dezelfde manier zeven balletjes worden getrokken? Er gaan grote geldsommen gepaard met Lotto (zie ‘Gokken op de wetenschap’), dus zo’n onderzoek kan zeker de moeite waard zijn. Het verschil van 23 procent voor de trekkingen tussen 2006 en 2011, en 35 procent van 2011 tot nu, springen zeker in het oog. Het feit dat er maar 10 procent kans is op dergelijke afwijkingen als het Lottomechanisme perfect willekeurig werkt, lijkt verontrustend. Maar je kan de redenering niet omdraaien en stellen dat er maar 10 procent kans is dat het mechanisme correct werkt. Statisticus Vyncke wil dan ook geen verregaande conclusies opvoeren. ‘Er zijn inderdaad grote verschillen tussen de kolommen, maar volgens mij zijn die aan het toeval te wijten.’ Hoe dan ook klopt de stelling van topeconoom Geert Noels niet helemaal. Hij beweert dat de lotto er is ‘voor de dommeriken’. Maar de genummerde balletjes zijn duidelijk ook voer voor ‘intelligente geesten’.

Gokken op de wetenschap

Sinds 4 februari 1978 organiseert de Nationale Loterij van België wekelijks het gokspel Lotto. De Nationale Loterij groeide uit de in 1934 opgerichte Koloniale Loterij, die officieel de bedoeling had om geld in te zamelen voor de kolonie, maar op affiches soms minder fraai uit de hoek kwam. In 2002 werd de Nationale Loterij een nv van publiek recht. Lotto bracht vorig jaar liefst 490 miljoen euro in het laatje van de Nationale Loterij. De helft van dat bedrag herverdeelt de nv als prijzengeld. De andere helft gaat, na aftrek van de werkingsmiddelen, naar subsidies voor projecten en organisaties – al moet het parlement wel zijn toestemming geven. Bij die projecten en organisaties zitten ook wetenschappelijke doelen. Gokken met Lotto is dus een manier om de wetenschap financieel te steunen.