Balancering af statistisk og klinisk betydning ved evaluering af behandlingseffekter / Postgraduate Medical Journal

P-værdi-ARR eller p-værdi-NNT plots

nulhypotesen er, at ARR for den nye behandling er mindre end H. P-værdier beregnes for et interval af værdier på h. disse p-værdier er afbildet på y-aksen og ARR på h-aksen. Derfor har vi for en række værdier af ARR den tilsvarende Sandsynlighed for, at de kliniske forsøgsobservationer ville være opstået tilfældigt, hvis den reelle ARR var mindre end de givne værdier. Beregningsmetoden er vist i tillæg (se s 203).

eksempel 1—undersøgelser med samme behandlingseffekter, men forskellige prøvestørrelser

Jeg vil illustrere dette plot ved at sammenligne resultaterne af tre fiktive undersøgelser med den samme forventede relative risiko, ARR og NNT. Stikprøvestørrelserne er imidlertid forskellige, og niveauerne af statistisk signifikans er også forskellige. I den første undersøgelse p >0,05 og er ikke statistisk signifikant, mens i den anden og tredje undersøgelse p< 0,05 og er statistisk signifikant.

Studie 1

behandlingsgruppe: 50 forsøgspersoner; 49 overlevede, en døde.

kontrolgruppe: 50 forsøgspersoner; 45 overlevede, fem døde.

ARR = 0, 08 (95% CI -0, 012 til 0, 172)

NNT = 12, 5 (95% CI og)

Studie 2

behandlingsgruppe: 250 forsøgspersoner; 245 overlevede, fem døde.

kontrolgruppe: 250 forsøgspersoner; 225 overlevede, 25 døde.

ARR = 0, 08 (95% CI 0, 039 til 0, 121)

NNT = 12, 5 (95% CI 8, 3 til 25, 7)

studie 3

behandlingsgruppe: 1250 forsøgspersoner; 1225 overlevede, 25 døde.

kontrolgruppe: 1250 forsøgspersoner; 1125 overlevede, 125 døde.

ARR = 0.08 (95% CI 0, 062 til 0, 100)

NNT = 12, 5 (95% CI 10, 2 til 16, 2)

beregningerne for ARR og NNT er beskrevet i tillæg . P-værdien-ARR-plottene er vist i figur 1a.da den forventede værdi for ARR er 0,08, er p-værdierne med nulhypotesen om, at den reelle absolutte risikoreduktion er mindre end 0,8, 0,5 for hver af de tre undersøgelser (se pil i figuren). Det vil sige, at de faktiske ARR-værdier er lige så sandsynlige at være over 0,08 som under 0,08. P-værdierne med nulhypotesen om, at behandlingen og kontrollerne er lige så effektive (dvs.ARR = 0) er mindre end 0.05 for Studie 2 og 3 (se skæringspunktet for kurverne med den lodrette akse). Dette er i overensstemmelse med 95% CI ikke inklusive nul. Figur 1a viser imidlertid også, at i undersøgelse 1 er den tilsvarende p-værdi over 0,05 (se intercept med den lodrette akse). Dette er i overensstemmelse med, at 95% CI er inklusive nul.

iv=”http://www.w3.org/1999/xhtml Figur 1

Plots for (a) p-værdi-ARR og (B) P-værdi-NNT.

Antag, at en kliniker kun anser behandlingen værd, hvis ARR er mere end 0,05. Ved anvendelse af traditionel 95% CI for ARR vil det konkluderes, at 95% CI for ARR inkluderer 0,05 for både studie 1 og 2. I Studie 2 var 95% CI for ARR i området fra 0,04 til 0,121. ARR på 0,05 er tæt på den lavere CI, men det er uklart, hvor sandsynligt, at den reelle ARR overstiger 0,05. Skal klinikeren fortsætte behandlingen med resultaterne i Studie 2?1a, at sandsynligheden for, at undersøgelsesobservationerne ville være opstået tilfældigt med nulhypotesen om, at den reelle ARR er mindre end 0,05, er 0,26, 0,08 og 0.000 for henholdsvis første til tredje undersøgelse (se skæringspunkterne mellem de tre kurver og den lodrette stiplede linje, mærket henholdsvis A, B og C). Mens p = 0,05 er det niveau, der normalt bruges som tærskel i statistiske tests, der bruges til at afgøre, om en behandling er mere effektiv end placebo, er denne tærskel muligvis ikke anvendelig til test af sandsynligheder for, at ARR er mindre end en forudbestemt klinisk signifikans. Faktisk ville de fleste klinikere bruge en meget højere tærskel—måske op til så meget som 0,2 (en ud af fem Sandsynlighed for, at resultater er opstået ved en tilfældighed). For eksempel i Studie 2 betyder niveauet p = 0,08, at chancen for, at observationerne er opstået tilfældigt, hvis ARR <0,05 kun er 0,08. Derfor er det meget mere sandsynligt end ikke, at det krævede niveau af klinisk betydning opnås. Dette er et godt argument for at bruge behandlingen. P-værdien-ARR-plottet giver en p-værdi for hvert klinisk signifikansniveau, der passer til de bestemte klinikere.

Tilsvarende kan p-værdier med deres 95% CI beregnes og afbildes for forskellige NNT-værdier ved hjælp af forholdet NNT = 1/ARR. Dette er vist i figur 1b. Ækvivalensen af ARR <0.05 er NNT >20. Figur 1b kan fortolkes på en lignende måde, der giver lignende konklusioner som dem fra figur 1a.

eksempel 2—undersøgelser med forskellige størrelser af behandlingseffekt og prøvestørrelser

fordelene ved p-værdien-ARR eller p-værdi-NNT-plots i forhold til CI kan vises bedre med to undersøgelser: en med en lavere statistisk, men en højere klinisk signifikans (undersøgelse 2 nedenfor) og en med en højere statistisk, men en lavere klinisk signifikans (undersøgelse 4 nedenfor).

Studie 2

behandlingsgruppe: 250 patienter; 245 overlevede, fem døde.

kontrolgruppe: 250 patienter; 225 overlevede, 25 døde.

ARR = 0, 08 (95% CI 0, 04 til 0, 121)

NNT = 12, 5 (95% CI 8, 3 til 25, 7)

studie 4

behandlingsgruppe: 2500 patienter; 2400 overlevede, 100 døde

kontrolgruppe: 2500 patienter; 2250 overlevede, 250 døde.

ARR = 0, 06 (95% CI 0, 05 til 0, 075)

NNT = 16, 7 (95% CI 13, 5 til 21, 8)

Antag først, at klinikeren beslutter, at en klinisk betydning af ARR>0.056 (dvs.NNT <18) er påkrævet, og at forskellige behandlinger undersøges i Studie 2 og 4. For begge undersøgelser ligger NNT-værdien på 18 inden for 95% CI. Det er ikke klart, hvilken, hvis nogen, af behandlingerne skal klinikeren bruge. Hvad hvis klinikeren beslutter, at det kliniske signifikansniveau er ARR >0.048 (det vil sige NNT <21)? Igen er denne NNT-værdi inden for CI for begge undersøgelser.

figur 2a viser p-værdien-ARR-plottet, og 2B viser p-værdien-NNT-plottet i Studie 2 og 4. Det ses tydeligt fra både fig 2A og 2B, at ved ARR >0.056 (det vil sige NNT <18) overstiger p-værdien af studie 4 Meget Studie 2, mens det omvendte er tilfældet på niveauet af ARR >0.048 (det vil sige NNT <21). På baggrund af dette plot kan klinikeren vælge behandlingen i studie 4, Hvis den krævede kliniske betydning er NNT <21, men vælg behandlingen i Studie 2, hvis den krævede kliniske betydning er NNT <18.

figur 2

Plots for (a) p-værdi-ARR og (B) p-værdi-NNT.

P-værdi-ARR eller p-værdi-NNT plots

eksempel 1—undersøgelser med samme behandlingseffekter, men forskellige prøvestørrelser

Studie 1

Studie 2

studie 3

eksempel 2—undersøgelser med forskellige størrelser af behandlingseffekt og prøvestørrelser

Studie 2

studie 4

Skriv et svar Annuller svar

You may like this....