Evidenzstufen 3 und 2:

„Nicht alles was glänzt ist Gold(standard)“

Am Beispiel einer Zulassungsstudie

Nicht-randomisierte, kontrollierte Kohortenstudien (Evidenzstufe 3) und randomisierte, kontrollierte Studien (kurz RCTs, Evidenzstufe 2) sind der Goldstandard für die Entwicklung neuer Medikamente, Diagnose- oder Präventionsmethoden. Im Folgenden möchten wir anhand der Zulassungsstudie des Covid-19-Impfstoffes von BioNTech/Pfizer [1] den qualitativ hochwertigsten Studientyp, die RCT,  vorstellen und bewerten. Wir erheben dabei keinen Anspruch auf Vollständigkeit und verweisen zur systematischen und ausführlichen Bewertung klinischer Studien auf weiterführende Literatur, wie Inhalte von Cochrane Deutschland [2].

Vorstellung  der Zulassungsstudie

Hintergrund, Methodik und Ergebnissen der BNT162b2-mRNA-Impfstoff-Studie

Hintergrund und Interessenskonflikte

Die Studie “Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine” wurde am 31.12.2020 von Polack et al im New England Journal of Medicine veröffentlicht [1]. Seit den letzten Ausbrüchen der Coronaviren  SARS-CoV-1 und MERS in den Jahren 2003 und 2012 wird an Coronaviren intensiviert geforscht. Mit dem Ausbruch der weltweiten SARS-CoV-2-Pandemie im Frühjahr 2020 besteht jedoch ein extremes Forschungsinteresse an der Behandlung und Prävention von Covid-19. Bis zum Datum der Veröffentlichung dieser Zulassungsstudie, waren in den USA und in den Europa noch keine anderen Impfstoffe zugelassen. Dieser finalen Phase-2/3-Studie des neuartigen mRNA-Impfstoffes ging bereits eine Phase 1 Studie voran, in der zwei verschiedene Impfstoffe in jeweils drei verschiedenen Dosierungen getestet wurden. Das deutsche Unternehmen BioNTech war zugleich Sponsor und Hersteller des BNT162b2-Vakzins. Das amerikanische Unternehmen Pfizer entwarf das Studienprotokoll, und war verantwortlich für die Datenerhebung, Analyse und Verfassung des Manuskripts. 

Methodik

Die Studie wurde als kontrollierte, randomisierte, verblindete Interventionsstudie designt: Den Teilnehmenden wurde im Abstand von 21 Tagen insgesamt zwei Dosen (30µg BNT162b2 oder Placebo) in den Oberarm injiziert. Kontrolliert bedeutet in diesem Zusammenhang, dass nur Hälfte der Teilnehmenden den Impfstoff erhielten (Interventionsgruppe), während der anderen Hälfte (Kontrollgruppe) lediglich das Placebo in Form einer Kochsalzlösung injiziert wurde. Randomisiert wurden die Teilnehmenden, indem ihnen per Zufallsprinzip eine der beiden Gruppen zugewiesen wurde. Weil lediglich die lokalen Verteiler den Inhalt der Injektion kannten, jedoch die  Teilnehmenden, Studienkoordinator:innen und das Studienpersonal nicht wussten, ob das Placebo oder der Impfstoff verabreicht wurde, spricht man zusätzlich von Verblindung. 

Vom 27. Juli bis zum 14. November 2020 wurden in 152 Zentren in den USA, Argentinien, Brasilien, Südafrika, Deutschland und Türkei Ländern insgesamt 44.820 Personen auf Eignung für die Studie untersucht. Einschlusskriterien waren neben einer Zustimmung nach Aufklärung über die Studie eine weitgehende Gesundheit oder stabile chronische Vorerkrankungen, die keine unmittelbare Therapieanpassungen benötigen. Eine Immunsuppression (medikamentös oder durch eine Erkrankung) und eine bereits stattgehabte Erkrankung mit COVID-19 galten als primäre Ausschlusskriterien. Insgesamt konnten letztendlich 43.448 Teilnehmende ab 16 Jahren in die Studie eingeschlossen werden – davon 21.720 in die Interventions- und 21.728 in die Kontrollgruppe. Bis zum vorläufigen Stichtag, dem 9.Oktober 2020 konnten wiederum Daten von 36.523 Teilnehmenden ausgewertet werden, die bis dahin zwei Monate lang konsekutiv beobachtet wurden. 

Für die Untersuchung von Sicherheit und Wirksamkeit des Impfstoffs wurden folgende Endpunkte untersucht: Als Impfreaktionen wurden spezifische lokale und systemische Reaktionen oder der Gebrauch fiebersenkender Medikamente innerhalb der ersten 7 Tagen nach jeder Dosis registriert. Zudem wurden im ersten Monat nach der zweiten Dosis jegliche unerwünschten Nebenwirkungen, sowie vom zweiten bis zum sechsten Monat (oder Cut-off-Tag) nach der zweiten Dosis jegliche schwere unerwünschte Nebenwirkungen erfragt. Ebenso wurde fortan ab dem achten Tag nach der zweiten Dosis das Erkrankungsrisiko mit Covid-19 untersucht. Als Covid-erkrankt galten die Teilnehmenden, die mindestens ein typisches Symptom von Covid-19 (Fieber, neuartiger oder aggravierter Husten, Kurzatmigkeit, Schüttelfrost, Gliederschmerzen, Geruchsverlust, Halsschmerzen, Durchfall, Erbrechen) und ein positives PCR-Testergebnis während der Symptome oder bis zu vier Tagen vor und nach der Symptome aufwiesen. Außerdem wurde die Anzahl der  schwer an Covid-19 Erkrankten (respiratorische Insuffizienz, akutes Leber- oder Nierenversagen, neurologische Beeinträchtigung, Intensivpflichtigkeit, Tod) erhoben.

Ergebnisse
Aus den Baseline-Charakteristika geht hervor, dass Daten zu 50,6% männlichen und 49,4% von weiblichen Teilnehmenden stamme, außerdem waren 58% unter und 42% über 55 Jahre alt, 35% übergewichtig. Die Mehrzahl der Teilnehmenden der Interventionsgruppe berichteten insbesondere nach der zweiten Impfdosis über lokalen Schmerz, der bis zwei Tage anhielt. Zu den häufigsten systemischen Nebenwirkungen zählten insbesondere bei den unter 55-Jährigen Müdigkeit (59%), Kopfschmerzen (52%) und Fieber (16%). Unerwünschte Nebenwirkungen traten häufiger in der Interventionsgruppe auf: darunter 0,3%, die von einer Lymphknotenschwellung berichten und bei jeweil einem Teilnehmenden  traten eine Schulterverletzung, Herzrhythmusstörung und eine Empfindungsstörung des rechten Beins auf. Zwei Todesfälle, die nach der Impfung mit BNT162b2 auftraten, konnten nicht auf die Impfung zurückgeführt werde. Ab dem siebten Tag nach der zweiten Dosis erkrankten aus der Interventionsgruppe 8 Menschen ohne und ein Mensch mit vorheriger nachgewiesener SARS-CoV2-Infektion an COVID-19, während aus der Kontrollgruppe 162 Menschen ohne und 7 Menschen mit vorheriger Infektion erkrankten. Daraus wurde eine Wirksamkeit von 95% berechnet. Es gab zudem keinerlei Hinweise darauf, dass die Wirksamkeit der Impfung vom Alter, Geschlecht oder der “race” und “ethnicity” abhängt. Ebenso konnte keine geringere Wirksamkeit bei vorbestehenden Erkrankungen wie Übergewicht und Bluthochdruck gefunden werden. 

Ausklappen

Bewertung der Zulassungsstudie

Gültigkeit, systematische Fehler und Übertragbarkeit der BNT162b2-mRNA-Impfstoff-Studie

Um die Gültigkeit der Ergebnisse zu untersuchen (interne Validität), benötigt es einer strukturierten Analyse des Risikos für systematische Fehler (Bias), wie sie in [4] ausführlich erläutert wird. Vereinfacht werden hier folgende wichtige Stichworte zur Qualitätsbewertung von RCTs untersucht: Die Studie war durch verdeckte Zuordnung über Regenerierung einer Allokations-Sequenz randomisiert (Ausschluss einer allocation bias). Darüber hinaus waren das Studienpersonal und die Proband*innen während der Behandlung bis zur Endpunkterhebung verblindet (Ausschluss von performance und detection bias). Die Endpunkte waren vorab klar definiert und sind im veröffentlichten Studienprotokoll [1] einsehbar (Ausschluss eines reporting bias).
Die Ergebnisse zeigen deutlich, dass die Impfung eine statistisch signifikante Risikoreduktion einer symptomatischen Erkrankung mit Covid-19 in den ersten 2 Monaten nach der zweiten Dosis bewirkt. Im Follow-up werden jedoch keine asymptomatischen Infektionen erfasst. Folglich können noch keinerlei Rückschlüsse daraus gezogen werden, ob auch eine Übertragung von SARS-CoV-2 durch die Impfung verhindert wird. Unklar bleibt außerdem bislang wie lange der Impfschutz anhält, da bisher nur das Erkrankungsrisiko in einem Zeitraum von 2 Monaten untersucht wurde. Bezüglich der Stärke des Effekts wird immer wieder behauptet, dass die Impfung kaum wirksam sei. Dabei beziehen sich Kritiker:innen meist auf die absolute Risikoreduktion. Das Risiko sich zwischen dem  siebten Tag nach der zweiten Dosis und dem Follow-up-Endpunkt an Covid-19 zu erkranken betrug ohne Impfung 0,884% und mit Impfung 0,044. Folglich ergibt sich die häufig genannte absolute Risikoreduktion von lediglich 0,84%. Berechnet man jedoch die relative Risikoreduktion für ein Individuum (0,044%/0,884%) ergeben sich sogar 99,95%. Daraus ergibt sich eine Number-Needed-To-Treat (die Anzahl der Menschen, die man impfen müsste, um eine Covid-19-Infektion zu verhindern) von 119.
Eine Übertragbarkeit der Ergebnisse (externe Validität) ist eingeschränkt gegeben, da die Untersuchungsobjekte die allgemeine Bevölkerung relativ gut repräsentieren.  Die Ergebnisse sind jedoch nicht auf Menschen mit schwerer Allgemeinerkrankung oder unter Immunsuppression übertragbar. Auch eine Anwendbarkeit für Kinder und Schwangere bleibt vorerst unklar. 

Ausklappen

Letztendlich ist jedoch sogar eine methodisch einwandfreie, große RCT nicht groß und aussagekräftig genug ist, um eine Forschungsfrage zuverlässig zu beantworten. Häufig sind Studienergebnisse sogar widersprüchlich, je nachdem an welchem Proband:innenkollektiv und mit welcher Methodik eine Forschungsfrage untersucht wurde. Widersprüchliche Ergebnisse sind also keinesfalls immer bedenklich, sondern Teil eines Forschungsprozesses. Kausalitäten lassen sich sehr viel schwieriger beweisen – die zuverlässige Beantwortung einer Forschungsfrage ergibt sich deshalb meist erst aus dem Gesamtbild. Dieser Prozess kann Jahrzehnte dauern und wird durch systematische Übersichtsarbeiten kontrolliert.

Literaturverzeichnis

[1] Polack FP, Thomas SJ, Kitchin N et al: Safety and Efficacy of the BNT162b2 mRNA Covid Vaccine. NEJM. December 21, 2020. [DOI: 10.1056/NEJMoa2034577]

[2] https://www.cochrane.de/de/literaturbewertung 

[3] AWMF, Cochrane Deutschland: Bewertung des Biasrisikos in klinischen Studien: ein Manual für die Leitlinienerstellung. 2016. https://www.cochrane.de/sites/cochrane.de/files/public/uploads/manual_biasbewertung.pdf 

[4] https://www.nejm.org/doi/suppl/10.1056/NEJMoa2034577/suppl_file/nejmoa2034577_protocol.pdf 

Kritische Medizin München © 2021