De zin en onzin van statistiek?

DOOR PAUL LEVRIE. Op 20 oktober is het Wereld Statistiek Dag. Als wiskundige heb ik hier een dubbel gevoel bij, en ik sta hierin niet alleen. Enerzijds zijn er de Sultans of Statistics als Nate Silver, anderzijds zijn er “Lies, damned lies, and statistics”.

Geschreven door wiskundige Paul Levrie. Hij heeft een eigen blog ‘wiskunde is sexy’
Paul Levrie

Paul Levrie

Vandaag, 20 oktober 2016, is het World Statistics Day. In 2010 vierden we dat het voor het eerst, de tweede keer was in 2015, en het lijkt dus alvast geen goed idee om het vieren uit te stellen tot de volgende keer. Het was de algemene vergadering van de Verenigde Naties die deze dag in 2010 uitriep tot Wereld Statistiek Dag, en ze wilden hiermee de belangrijke rol van statistiek in onze maatschappij bevestigen. Statistics Awareness Day zou een betere naam zijn geweest, maar dat zou al snel geleid hebben tot een ongelukkig acroniem. Dat is waarschijnlijk ook de reden waarom er geen Mathematics Awareness Day is (er is in de VS overigens wel een Mathematics Awareness Month, die misschien eerder toevallig begint op 1 april).

Mijn gevoel als wiskundige bij statistiek is erg dubbel. Aan de ene kant heb ik er grote problemen mee, en ik niet alleen. Iedereen kent wel de uitspraak, toegeschreven aan Mark Twain:

“There are three kinds of lies: lies, damned lies and statistics.”

De humorist Stephen Leacock, het Canadese equivalent van Godfried Bomans, zei het zo:

“In ancient times they had no statistics so they had to fall back on lies.”

En kent u deze (fout geciteerde uitspraak) van de dichter A.E. Housman?

“Politicians use statistics as a drunken man uses a lamppost: for support rather than for illumination.”

En inderdaad, het grote probleem met statistiek is dat het echt niet moeilijk is om de verkeerde conclusies te trekken. Zo zou je kunnen denken dat je met de wagen best versnelt aan een kruispunt, omdat de meeste ongevallen op kruispunten gebeuren. Of dat verjaren gezond is, want statistieken tonen aan dat mensen die vaak verjaren het oudst worden. Er zijn ook heel wat boeken die specifiek deze problematiek behandelen, en de titels liegen er niet om:

boeken

Aan de andere kant is het belang van statistiek niet te onderschatten. Dit is een gedeelte van een boodschap die president Barack Obama in 2010 de wereld instuurde naar aanleiding van de eerste World Statistics Day:

“Statistical data drives countless decisions which impact our Nation. It guides representation in the United States Congress; informs our economic, social service, and national security outlook; and helps determine where infrastructure like schools, hospitals, and roads should be built.”

Maar het is belangrijk om die statistische data op de juiste manier te gebruiken, en dat is niet altijd eenvoudig. Soms lukt het wel, en in dat geval wordt “The unreasonable effectiveness of statistics” (om even de fysicus Eugene Wigner te parafraseren) zichtbaar. Een mooi voorbeeld hiervan vinden we bij de Amerikaan Nate Silver, die ook wel de Sultan of Statistics genoemd wordt. Oorspronkelijk gespecialiseerd in sabermetrics, de analyse van baseballresultaten en –spelers m.b.v. statistiek, legde statisticus Silver zich de laatste jaren ook toe op psephology: de studie van statistieken die betrekking hebben op verkiezingen, vooral met het oog op het voorspellen van de verkiezingsresultaten. In 2012, toen Barack Obama het in de presidentsverkiezingen opnam tegen Mitt Romney, voorspelde Silver m.b.v. zijn wiskundig model met 100% nauwkeurigheid de winnaar voor elk van de 50 staten van Amerika. Daarmee gaf hij alle politieke experts het nakijken! Op zijn website FiveThirtyEight.com (538 is het aantal kiesmannen in het speciale kiessysteem in Amerika) kan je van naaldje tot draadje volgen hoe hij hierbij te werk gaat, een aanrader voor wie in statistiek geïnteresseerd is. De website heeft allerlei prijzen gewonnen. Dat het ook hier soms mis kan gaan bleek in juni 2015 toen op FiveThirtyEight voorspeld werd dat de kans op een nominatie voor Donald Trump extreem klein was. Toen die er toch kwam, sloeg Nate Silver een publiek mea culpa. Maar het blijft natuurlijk statistiek, en dat is nu eenmaal geen exacte wetenschap. We zijn benieuwd naar wat hij er bij deze verkiezingen van terecht zal brengen.

Het grote probleem met statistiek is dat het echt niet moeilijk is om de verkeerde conclusies te trekken

Ik heb nooit statistiek gedoceerd, maar ik kan me voorstellen dat de charme hiervan precies dat enigszins controversiële karakter is, iets wat je bij een vak zoals wiskunde absoluut niet hebt. Je hebt de believers en de non-believers, en dat maakt statistiek in zekere zin veel spannender dan wiskunde.

cartoon


Eén reactie

  1. En als je dan een naam draagt zoals de Noorse professor geografie Just Gjessing, dan heb je dus duidelijk je roeping gemist.

  2. Statistiek is belangrijk, en we verplichten in hoger onderwijs hele volksstammen te doen alsof ze er verstand van hebben. Is het niet raar dat niemand echt nieuwe dingen probeert om het begrijpelijk te maken? Twee jaar terug steunde ik een half geslaagde Indiegogo campagne, https://www.indiegogo.com/projects/timmy-s-journey-a-statistics-game/x/3553626#/ , denk nog altijd dat we meer van dat soort initiatief moeten hebben (en die dan ook tot uitvoering laten komen).

  3. Dit is op X, Y of Einstein? herblogden reageerde:
    De zin “Maar het blijft natuurlijk statistiek, en dat is nu eenmaal geen exacte wetenschap. ” doet op zijn minst eerst glimlachen en daarna denken en twijfelen.


Reacties zijn gesloten.