Wetenschappelijk onderzoek zit vaak vol valkuilen. Voor je het weet is er een verkeerd verband gelegd.

Vooral nu onderzoekers zich storten op grote databestanden die voor andere doeleinden zijn verzameld, de zogenoemde big data. “Let goed op voordat je conclusies trekt”, aldus Saskia Le Cessie, hoogleraar Medische Statistiek aan de Universiteit Leiden, die 22 september haar oratie uitsprak.

Geeft roken een hoger risico op dementie? Moet een bevalling ingeleid worden bij een groeivertraging? En leiden drie koppen koffie per dag tot minder trombose? Op dit soort vragen hopen medisch onderzoekers antwoord te krijgen door grote groepen mensen te bestuderen. Ze vergelijken vaak twee groepen en zoeken dan naar oorzaak en gevolg.

Maar het is vaak niet eenvoudig om de juiste conclusies te trekken uit dergelijk epidemiologisch onderzoek. Resultaten kunnen door toeval afwijken of vertekend zijn. “Een goede onderzoeksopzet en het gebruik van de juiste statistiek is daarom van groot belang”, aldus Saskia Le Cessie, hoogleraar Statistische Methoden in Observationeel (Klinisch) Epidemiologisch Onderzoek, die 22 september haar oratie uitsprak. “Stap daarom op tijd naar een statisticus waarmee je de onderzoeksopzet doorneemt of volg een goede cursus. Zorg dat je snapt wat je doet en weet waar de valkuilen zitten.’’

Koffiedrinkers

Doorgaans zijn er twee typen klinische studies: gerandomiseerd en observationeel onderzoek. In het eerste type wijst de onderzoeker via loting mensen toe aan twee groepen, die ieder een andere interventie krijgen, en kijkt dan naar de verschillen. In observationeel onderzoek vindt geen behandeling plaats, maar vergelijkt een onderzoeker een specifieke groep, bijvoorbeeld koffiedrinkers, met een niet-specifieke groep, theedrinkers in dezelfde leeftijdsgroep, en kijkt dan of er in de groep van koffiedrinkers vaker een bepaalde aandoening voorkomt.

Vertekend beeld

Beide typen onderzoek hebben hun eigen tekortkomingen. Gerandomiseerd onderzoek is duur en de onderzoeker moet lang, soms vele jaren, wachten op het antwoord. Observationeel onderzoek duurt vaak minder lang, maar het direct vergelijken van groepen kan een vertekend beeld geven. Le Cessie: “Koffiedrinkers zijn in het algemeen anders dan thee- of waterdrinkers, ze houden er een andere levensstijl op na en behoren vaker tot het mannelijk geslacht.”

Om het echte effect van koffie drinken op bijvoorbeeld trombose dan goed te kunnen bepalen, moeten er speciale statistische methoden aan te pas komen. “Het goede nieuws is dat we steeds complexere problemen kunnen oplossen”, aldus Le Cessie. “Ons vakgebied ontwikkelt zich in hoog tempo. Causaal modelleren heet dat. Maar er is nog een hoop werk te doen. Hoe ga je met veel vertekeningen tegelijkertijd om bijvoorbeeld, dat soort problemen proberen wij de komende jaren verder uit te zoeken.”

Big data

De laatste jaren maakt ook een andere soort epidemiologische studie opgang: het analyseren van grote bestaande databestanden die voor een ander doel waren opgezet. Hulpverleners verzamelen in elke spreekkamer gigantische hoeveelheden data. Daarvan worden sommige nu in hoog tempo geschikt gemaakt voor epidemiologisch onderzoek. De verwachtingen van de analyse van deze ‘big data’ zijn hoog, omdat je met slimme computers veel nieuwe verbanden zou kunnen vinden. Maar Le Cessie tempert die verwachtingen. “Je komt er dezelfde problemen tegen als bij de standaard epidemiologische studies. En vaak nog veel meer. Want de gegevens kunnen bijvoorbeeld invoerfouten bevatten die niet problematisch waren voor het doeleinde waarvoor ze verzameld waren, maar wel voor het epidemiologisch onderzoek. Bovendien is vaak niet bekend hoe er geregistreerd is, met welke intentie, en of artsen dat allemaal op dezelfde manier deden. Ook hier geldt dus: opletten voordat je conclusies trekt.”

Bron: LUMC