met maximale efficiëntie en zeggingskracht

Ivo van den Elskamp beschrijft een onderzoek naar de beste statistische methodes voor het trekken van conclusies uit MRI’s voor het diagnosticeren en inschatten van de mate van MS. Ivo deed ook onderzoek naar de benodigde statistische methode om de invloed van medicijnen op de hersenen van mensen, die voor MS behandeld worden, juist op een MRI te kunnen beoordelen. Verder geeft het proefschrift een onderzoek naar de methodiek om tevoren vast te kunnen stellen hoeveel proefpersonen minimaal in een geplande trial moeten worden opgenomen om een verantwoorde conclusie te kunnen trekken. Natuurlijk is de juiste beoordelingsstatistiek zowel ethisch als economisch van groot belang.

Samenvatting proefschrift Ivo van den Elskamp
proefschrift-100730-elskampcoverbMultiple Sclerose (MS) is een chronische ontstekingsziekte van de hersenen en het ruggenmerg en is de meest voorkomende neurologische oorzaak van lichamelijke beperking bij jong volwassenen tussen de 20 en 40 jaar. MS wordt gekarakteriseerd door meerdere (multiple) ontstekingsreacties gericht tegen de beschermende en isolerende laag rondom de zenuwvezels (myelineschede). Door de schade aan de myelineschede en de onderliggende zenuwvezels treedt er verlittekening (sclerose) op waardoor zenuwen niet goed meer in staat zijn om impulsen van en naar de hersenen te verwerken. Dit vertaalt zich in neurologische uitvalsverschijnselen, zoals loop en gevoelstoornissen, problemen met het gezichtsvermogen, seksuele functiestoornissen, vermoeidheid en verlies van controle over blaas en darmen. Welk symptoom optreedt, is afhankelijk van het deel van het zenuwstelsel dat is aangetast. Door de opeenstapeling van beschadigingen gaat een patiënt met MS neurologisch langzaam steeds verder achteruit. Hoewel de oorzaak van MS nog onbekend is, is wel duidelijk dat zowel omgevingsfactoren als genetische factoren een rol spelen. Zo is het bekend dat MS vaker voorkomt bij mensen die wonen in gematigde klimaatzones, en MS vaker voorkomt bij mensen met MS in de familie.
Magnetic Resonance Imaging (MRI) is een belangrijke en geavanceerde beeldvormingstechniek die wordt gebruikt om de verschillende aspecten van het pathologische proces van MS te visualiseren. Gebieden van ontsteking in de vroege fase van de ziekte kunnen bijvoorbeeld worden aangetoond met behulp van T1 gewogen beelden na toediening van een intraveneus contrastmiddel terwijl gebieden met verlies van myeline en blijvende zenuwschade (ook we persisterende “black holes” genoemd) juist het beste worden gevisualiseerd met T1 gewogen beelden zonder toediening van contrast. MRI kan ook gebruikt worden om de mate van volumeafname van het brein (atrofie), als gevolg van verlies van myeline en de onderliggende neuronen, te bepalen. Met Magnetic Transfer Imaging (MTI) tenslotte, kan zeer specifiek de mate van myelinisatie op een bepaalde plaats in het brein worden bepaald.
Elke manier van afbeelden met MRI zoals hierboven kort beschreven geeft een ander deel van het pathologische spectrum van de ziekte MS weer. Door het aantal afgebeelde sclerotische plekken in de hersenen te tellen, of het volume van de hersenen in de tijd te vervolgen, kan de progressie van de ziekte in de tijd gekwantificeerd worden. Om deze reden is MRI een belangrijk hulpmiddel bij het onderzoek naar de effectiviteit van geneesmiddelen, waarbij het aantal sclerotische plekken of het breinvolume dienen als zogenaamde uitkomstmaten. De gebruikte MRI uitkomstmaat is daarbij afhankelijk van het gebruikte experimentele medicijn.Wanneer het te onderzoeken medicijn een anti-inflammatoire werking heeft, dan zijn MRI-uitkomstmaten die de mate van ontsteking visualiseren het meest geschikt, maar wanneer het nieuwe medicijn het beschermen van neuronen tegen beschadiging en afbraak als effect heeft, dan verdienen uitkomstmaten die een afspiegeling geven van de hoeveelheid hersenweefselverlies de voorkeur.

Gouden standaard

De wetenschappelijke gouden standaard voor het vaststellen van de effectiviteit van een nieuw medicijn is het uitvoeren van een klinische trial. In dit onderzoekstype wordt op een gecontroleerde manier een groep proefpersonen behandeld met het te onderzoeken, experimentele medicijn en een tweede groep met een placebo, een niet van het echte medicijn te onderscheiden middel zonder farmacologisch effect. Een verschil in uitkomst tussen de twee groepen (dus: een verschil in aantal sclerotische plekken, of een verschil in de hoeveelheid atrofie van het brein tijdens de onderzoeksperiode) is dan toe te schrijven aan het effect van het experimentele medicijn.

Omdat het onderzoek echter gedaan is met een steekproef, een selectie patiënten uit de totale patiëntenpopulatie, bestaat er een zekere mate van onzekerheid betreffende het gevonden effect, wat in theorie ook op toeval zou kunnen berusten. De rol van toeval kan gekwantificeerd worden met behulp van statistische toetsing. Simpel geformuleerd geeft een statistische toets de kans weer dat een gevonden verschil tussen de twee groepen door toeval gevonden kan zijn (p-waarde). Een kleine p-waarde (in de wetenschap wordt vaak de grens (alpha) van een p-waarde kleiner dan 0.05 aangehouden) leidt dan tot de conclusie dat het niet waarschijnlijk is dat het resultaat door toeval ontstaan kan zijn en dat het gevonden effect derhalve statistisch significant bevonden kan worden.
De statistische power van een toets is de mogelijkheid van een toets om een verschil tussen twee groepen die worden onderzocht te detecteren, gegeven dat het verschil ook in werkelijkheid bestaat. Hoewel er geen formele standaard bestaat, wordt een power van 80% als acceptabel beschouwd. Er zijn drie factor0 van invloed op deze power. Ten eerste wordt de power van een toets groter naarmate het gevonden verschil tussen de twee groepen die onderzocht worden groter is. Ten tweede is de power van een toets afhankelijk van de vooraf gespecificeerde grens (alpha) waarbij een hoger gestelde grens overeenkomt met een hogere power. Tenslotte is de power afhankelijk van het aantal proefpersonen wat gebruikt is in het onderzoek, de zogenaamde steekproefgrootte, of sample size. Hoe groter de sample size, hoe groter de power.

Om in het ontwikkelingsproces voorafgaand aan de klinische trial een zo efficiënt mogelijk onderzoek op te zetten is het gebruikelijk om een poweranalyse uit te voeren, waarbij aan de hand van het verwachtte effect, en een vastgestelde alpha en power, de benodigde sample size kan worden geschat. Zonder een dergelijke analyse bestaat de kans dat het aantal participerende proefpersonen te laag is en de trial daarmee de precisie ontbeert om een verschil aan te tonen. Is de sample size juist te groot, dan worden proefpersonen onnodig blootgesteld aan mogelijk schadelijke bijwerkingen, en worden onnodig middelen, geld en tijd verspild.
In een tijd waarin de beschikbaarheid van bewezen effectieve medicamenteuze behandelingen het gebruik van placebo gecontroleerde klinische trials bemoeilijken en onderzoek naar neuroprotectieve medicamenten steeds belangrijker wordt, is zowel het gebruik van sensitieve en pathologisch specifieke MRI uitkomstmaten, als ook het vooraf zo accuraat mogelijk bepalen van de benodigde sample size voor de efficiënte opzet van een klinische trial van groot belang.

Doel van het onderzoek

Het doel van het onderzoek zoals beschreven in dit proefschrift, was het exploreren van de statistische power van conventionele en niet-conventionele MRI uitkomstmaten en de toepasbaarheid ervan in klinische trials, door middel van het schatten van het benodigde aantal proefpersonen voor toekomstige klinische trials met behulp van statistische power analyses. In hoofdstuk 2 komen MRI uitkomstmaten aan bod die toepasbaar zijn voor het monitoren van de mate van inflammatie in het brein. In hoofdstuk 2.1 betreft het het aantal contrast aankleurend MS laesies. Eerdere studies hebben aangetoond dat het statistische negatief binomiaal (NB) model een goede beschrijving geeft van de verdeling van deze uitkomstmaat in heterogene populaties van actieve MS patiënten, waarbij niet uitgesloten was of alternatieve verdelingen een betere fit zouden geven. In dit hoofdstuk bestudeerden we daarom de fit van een aantal bekende alternatieve statistische verdelingen in twee grote groepen Relapsing Remitting MS (RRMS) patiënten enNvonden dat de meest optimale en constante verdeling voor het modelleren van het aantal aankleurende laesies inderdaad het NB model was.

In hoofdstuk 2.2 pasten we de NB verdeling toe in een onderzoek waarin we het cumulatief aantal aankleurende laesies vergeleken met het aantal T2 subtractielaesies in een klinische trial. Met behulp van regressie modellen gebaseerd op de NB verdeling kon, in tegenstelling tot de non-parametrische Mann-Whitney U toets, wel een effect van het toegepaste geneesmiddel aangetoond worden. Het gebruik van T2 subtractielaesies gaf daarbij een 22-33% daling in het benodigde hoeveelheid patiënten. De toename in power als gevolg van gebruik van een parametrische analyse methode werd hiermee duidelijk geïllustreerd en onderstreept de toegevoegde waarde van het bestuderen van de statistische verdeling van MRI uitkomstmaten in klinische trials.

In hoofdstuk 2.3 wordt een studie beschreven waarin de statistische verdeling van het volume van aankleurende laesies werd geëxploreerd. Laesievolumes hebben in potentie een hogere sensitiviteit voor het oppikken van behandelingseffecten vergeleken met laesieaantallen. Laesievolumes bleken sterk scheef rechts verdeeld te zijn met een groot aantal discrete “nullen”. Daarom werd een zogenaamd mixture model van de binomiale verdeling (welke de aan- of afwezigheid van een laesie beschreef) en de Weibull verdeling (welke het volume van de aanwezige laesies beschreef) toegepast. De sample size schattingen op basis van het softwarematig simuleren van klinische trials met deze mixture verdeling werden vervolgens vergeleken met sample size schattingen voor het aantal aankleurende laesies als uitkomstmaat, en lieten zien dat de benodigde sample size voor een trial met laesievolumes als uitkomstmaat lager is dan die voor laesieaantallen als uitkomstmaat. Deze studie toont daarmee het potentiële voordeel in power voor het gebruik van volume van aankleurende laesies als uitkomstmaat.
In hoofdstuk 3 komen drie uitkomstmaten aan bod die pathologische specifiek zijn voor het meten van neuroprotectie en reparatie. Hoofdstuk 3.1 beschrijft een studie waarin voor het aantal persisterende black holes, een uitkomstmaat gericht op het meten van focale neuronale schade, werd aangetoond dat het een toepasbare maat is voor toekomstige klinische trials, mits een sterk effectief medicijn wordt gebruikt, waarbij 30 tot 200 personen per groep nodig zijn om een statistisch significant effect aan te tonen. In hoofdstuk 3.2 analyseerden we het benodigde aantal patiënten per groep wanneer cerebrale atrofie, een uitkomstmaat voor de globale neuronale schade in het brein, werd gebruikt. Eerdere studies toonden aan dat deze maat toepasbaar was in studies met een tijdsduur van 1 tot 3 jaar.

In de studie beschreven in dit proefschrift onderzochten we de toepasbaarheid van cerebrale atrofie in trials’rnet een tijdsduur van 6 maanden. We vonden een 0.33% afname in breinvolume over deze periode, en lieten zien dat, net als voor het aantal persisterende black holes, een krachtig medicijn nodig is om voldoende power te ontwikkelen voor een toepasbare sample size. In de studie beschreven in hoofdstuk 3.3 tenslotte, onderzochten we de toepasbaarheid van MTI als primaire uitkomstmaat. Deze maat is een kwantitatieve maat specifiek voor de hoeveelheid myeline en daarmee een potentiële uitkomst voor onderzoeken naar het effect van medicamenten die remyelinisatie induceren. Met behulp van complexe multilevel regressie modellen toonden we aan dat, afhankelijk van het verwachtte effect, 48 tot 136 patiënten nodig zijn voor het significant aantonen van het effect, waaruit we concludeerden dat MTI een krachtige uitkomstmaat is voor toekomstige trials.

Proefschrift: Powerful outcome measures in MS.
Promotoren: Prof.dr. F. Barkhof en prof.dr. B.J.M. Uitdehaag
Copromotor: dr. D.L. Knol

Curriculum Vitae

icon-1 Personalia
Naam:     Ivo van den Elskamp
Geboren: Amsterdam, 8 december 1978

icon-2 Opleiding:
1990 tot 1996 Atheneum Chr. Scholengemeenschap Damstede, Amsterdam

Propedeuse Medische Biologie VU Amsterdam

2003 Arts-examen VU Amsterdam

2009 Masteropleiding Epidemiologie

icon-3 Werkervaring:
2004 – 2005 – Arts-ass. Chirurgie en later poortarts in Westfriesgasthuis Hoorn

2005 – 2010 – Promotieonderzoek VU bij Prof. dr. Barkhof

2009 – heden – Arts-in opleiding tot radioloog VUmc

Promotie:

03 juni 2010, VUmc Amsterdam