Balancing statistical and clinical significance in evaluating Treatment effects / Postgraduate Medical Journal

p-Wert-ARR- oder p-Wert-NNT-Plots

Die Nullhypothese ist, dass der ARR für die neue Behandlung kleiner als x ist. p-Werte werden für einen Wertebereich von x berechnet. Diese p-Werte werden auf der y-Achse und der ARR auf der x-Achse aufgetragen. Daher haben wir für einen Bereich von Werten von ARR die entsprechende Wahrscheinlichkeit, dass die Beobachtungen in klinischen Studien zufällig entstanden wären, wenn die reale ARR kleiner als die angegebenen Werte gewesen wäre. Die Berechnungsmethode ist im Anhang dargestellt (siehe S. 203).

BEISPIEL 1— STUDIEN MIT GLEICHEN BEHANDLUNGSEFFEKTEN, ABER UNTERSCHIEDLICHEN Stichprobengrößen

Ich werde diese Darstellung veranschaulichen, indem ich die Ergebnisse von drei fiktiven Studien mit demselben erwarteten relativen Risiko, ARR und NNT, vergleiche. Die Stichprobengrößen sind jedoch unterschiedlich und auch die statistische Signifikanz ist unterschiedlich. In der ersten Studie p>0,05 und ist statistisch nicht signifikant, während in der zweiten und dritten Studie p<0,05 und ist statistisch signifikant.

Studie 1

Behandlungsgruppe: 50 Probanden; 49 überlebten, einer starb.Kontrollgruppe: 50 Probanden; 45 überlebten, fünf starben.

ARR = 0,08 (95% CI -0,012 bis 0,172)

NNT = 12,5 (95% CI und )

Studie 2

Behandlungsgruppe: 250 Probanden; 245 überlebten, fünf starben.Kontrollgruppe: 250 Probanden; 225 überlebten, 25 starben.

ARR = 0,08 (95%-KI 0,039 bis 0,121)

NNT = 12,5 (95% -KI 8,3 bis 25,7)

Studie 3

Behandlungsgruppe: 1250 Probanden; 1225 überlebten, 25 starben.Kontrollgruppe: 1250 Probanden; 1125 überlebten, 125 starben.

ARR = 0.08 (95%-KI 0,062 bis 0,100)

NNT = 12,5 (95% -KI 10,2 bis 16,2)

Die Berechnungen für ARR und NNT sind im Anhang aufgeführt . Die p-Wert-ARR-Diagramme sind in Abbildung 1A dargestellt. Da der erwartete Wert für ARR 0,08 beträgt, beträgt der p-Wert mit der Nullhypothese, dass die tatsächliche absolute Risikoreduktion kleiner als 0,8 ist, für jede der drei Studien 0,5 (siehe Pfeil in der Abbildung). Das heißt, die tatsächlichen ARR-Werte sind ebenso wahrscheinlich über 0,08 wie unter 0,08. Die p-Werte mit der Nullhypothese, dass die Behandlung und die Kontrollen gleich wirksam sind (dh ARR = 0), sind kleiner als 0.05 für die Studien 2 und 3 (siehe Schnittpunkt der Kurven mit der vertikalen Achse). Dies entspricht dem 95% -KI ohne Null. Figur 1A zeigt jedoch auch, dass in Studie 1 der entsprechende p-Wert über 0,05 liegt (siehe Schnittpunkt mit der vertikalen Achse). Dies steht im Einklang damit, dass das 95% -KI Null einschließt.

iv xmlns:xhtml=“http://www.w3.org/1999/xhtml Abbildung 1

Diagramme für (A) p-Wert-ARR und (B) p-Wert-NNT.

Angenommen, ein Kliniker hält die Behandlung nur dann für sinnvoll, wenn die ARR mehr als 0,05 beträgt. Unter Verwendung des traditionellen 95% -KI für ARR wird der Schluss gezogen, dass das 95% -KI für ARR umfasst 0,05 für beide Studien 1 und 2. In Studie 2 lag das 95% -KI für ARR zwischen 0,04 und 0,121. Der ARR von 0,05 liegt nahe am unteren CI, es ist jedoch unklar, wie wahrscheinlich es ist, dass der reale ARR 0,05 überschreitet. Sollte der Arzt die Behandlung mit den Ergebnissen in Studie 2 fortsetzen?1A ist jedoch ersichtlich, dass die Wahrscheinlichkeiten, dass die Studienbeobachtungen zufällig mit der Nullhypothese entstanden wären, dass der reale ARR kleiner als 0,05 ist, 0,26, 0,08 und 0 sind.000 für die erste bzw. dritte Studie (siehe Schnittpunkte zwischen den drei Kurven und der vertikalen gestrichelten Linie mit den Bezeichnungen A, B bzw. C). Während p = 0,05 der Wert ist, der normalerweise als Schwellenwert in statistischen Tests verwendet wird, um zu entscheiden, ob eine Behandlung wirksamer als Placebo ist, kann dieser Schwellenwert nicht zum Testen von Wahrscheinlichkeiten verwendet werden, dass die ARR kleiner als eine vorbestimmte klinische Signifikanz ist. Tatsächlich würden die meisten Kliniker einen viel höheren Schwellenwert verwenden – vielleicht bis zu 0,2 (eine von fünf Wahrscheinlichkeiten, dass Ergebnisse zufällig entstanden sind). In Studie 2 bedeutet der Pegel p = 0,08 beispielsweise, dass die Wahrscheinlichkeit, dass die Beobachtungen zufällig entstanden sind, wenn ARR <0,05 nur 0,08 beträgt. Daher ist es viel wahrscheinlicher, dass das erforderliche Maß an klinischer Signifikanz erreicht wird. Dies ist ein gutes Argument, um die Behandlung zu verwenden. Das p-Wert-ARR-Diagramm gibt einen p-Wert für jedes klinische Signifikanzniveau an, das für die jeweiligen Kliniker geeignet ist.

In ähnlicher Weise können p-Werte mit ihrem 95% -KI für verschiedene NNT-Werte berechnet und aufgetragen werden, wobei die Beziehung NNT = 1 / ARR verwendet wird. Dies ist in Fig.1B dargestellt. Die Äquivalenz von ARR <0.05 ist NNT >20. Abbildung 1B kann auf ähnliche Weise interpretiert werden und liefert ähnliche Schlussfolgerungen wie Abbildung 1A.

BEISPIEL 2—STUDIEN MIT UNTERSCHIEDLICHER Größe DES BEHANDLUNGSEFFEKTS UND DER STICHPROBENGRÖßEN

Die Vorteile der p-Wert-ARR- oder p-Wert-NNT-Diagramme gegenüber dem KI können mit zwei Studien besser gezeigt werden: eine mit einer niedrigeren statistischen, aber einer höheren klinischen Signifikanz (Studie 2 unten) und eine mit einer höheren statistischen, aber einer niedrigeren klinischen Signifikanz (Studie 4 unten).

Studie 2

Behandlungsgruppe: 250 Patienten; 245 überlebten, fünf starben.Kontrollgruppe: 250 Patienten; 225 überlebten, 25 starben.

ARR = 0,08 (95%-KI 0,04 bis 0,121)

NNT = 12,5 (95% -KI 8,3 bis 25,7)

Studie 4

Behandlungsgruppe: 2500 Patienten; 2400 überlebten, 100 starben

Kontrollgruppe: 2500 Patienten; 2250 überlebten, 250 starben.

ARR = 0,06 (95% -KI 0,05 bis 0,075)

NNT = 16,7 (95% -KI 13,5 bis 21,8)

Angenommen, der Kliniker entscheidet zunächst, dass eine klinische Signifikanz von ARR >0.056 (d. h. NNT <18) erforderlich ist und dass in den Studien 2 und 4 unterschiedliche Behandlungen untersucht werden. In beiden Studien liegt der NNT-Wert von 18 innerhalb des 95% -KI. Es ist nicht klar, welche, wenn überhaupt, der Behandlungen sollte der Kliniker verwenden. Was ist, wenn der Kliniker entscheidet, dass das klinische Signifikanzniveau ARR >0,048 ist (dh NNT <21)? Auch dieser NNT-Wert liegt innerhalb des KI beider Studien.

Abbildung 2A zeigt das p-Wert-ARR-Diagramm und 2B zeigt das p-Wert-NNT-Diagramm der Studien 2 und 4. 2A und 2B ist deutlich zu erkennen, dass bei ARR >0,056 (d. h. NNT <18) der p-Wert von Studie 4 Studie 2 deutlich übersteigt, während das Gegenteil auf der Ebene von ARR >0,048 (d. h. NNT <21). Auf der Grundlage dieses Diagramms kann der Kliniker die Behandlung in Studie 4 auswählen, wenn die erforderliche klinische Signifikanz NNT <21 ist, aber Wählen Sie die Behandlung in Studie 2, wenn die erforderliche klinische Signifikanz NNT <18 ist.

Abbildung 2

Diagramme für (a) p-Wert-ARR und (B) p-Wert-NNT.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.