Fixeffekt- und Random-Effects-Modelle in der Meta-Analyse

Systematische Übersichtsarbeiten sind methodische Ansätze zur Synthese von Evidenz, die strukturierte klinische Fragestellungen adressieren. Sie verwenden systematische und explizite Methoden, um relevante Studien zu identifizieren, zu screenen, kritisch zu bewerten sowie Daten zu extrahieren und zu analysieren. Eine Meta-Analyse hingegen ist ein statistisches Verfahren, das quantitative Ergebnisse primärer Studien zu derselben Fragestellung kombiniert, um eine gepoolte Schätzung des Effekts mit Konfidenzintervall (KI) zu generieren. Meta-Analysen können die statistische Power erhöhen, die Präzision verbessern und Fragen beantworten, die einzelne Studien aufgrund unzureichender Power nicht klären können. Obwohl nicht alle systematischen Übersichtsarbeiten Meta-Analysen erfordern, bieten diese – bei angemessener Durchführung und Berichterstattung – wertvolle Informationen für Kliniker, Forscher und politische Entscheidungsträger.

Um die Konzepte von Fixeffekt- und Random-Effects-Modellen zu veranschaulichen, betrachten Sie folgende Analogie: In einer Studie mit 50 Lehrkräften wird die Wirksamkeit eines neuen Mathematikcurriculums evaluiert. Die Klassen jeder Lehrkraft werden randomisiert, sodass die Hälfte das alte und die andere Hälfte das neue Curriculum erhält. Der Effekt der Curricula auf Prüfungsergebnisse der Schüler wird analysiert. Dieses Szenario wirft zwei Fragen mit unterschiedlichen Annahmen auf:

Frage 1: Bei diesen 50 Lehrkräften (und keinen anderen) – welchen Einfluss haben die beiden Curricula auf die Prüfungsergebnisse? (Annahme 1: Der Effekt des neuen Curriculums ist bei allen Lehrkräften identisch.)

Frage 2: Bei allen potenziellen Lehrkräften, von denen diese 50 eine zufällige Stichprobe darstellen – welchen Einfluss haben die Curricula? (Annahme 2: Der Effekt variiert zwischen Lehrkräften, z. B. aufgrund unterschiedlicher Lehrfähigkeiten.)

Der Unterschied liegt in der Zielpopulation und den Annahmen: Interessiert der Effekt nur in der konkreten Stichprobe (Frage 1) oder in einer generellen Population (Frage 2)? Ersetzt man „Lehrkräfte“ durch „Studien“ und „Curricula“ durch „Therapien“, erhält man die Grundlage für Fixeffekt- (Frage 1) und Random-Effects-Modelle (Frage 2).

In Meta-Analysen werden Daten mittels Fixeffekt- oder Random-Effects-Modellen kombiniert. Die Modellwahl ist komplex und unter Biostatistikern umstritten. Tabelle 1 fasst die Unterschiede anhand konzeptueller, statistischer und praktischer Kriterien zusammen.

Ein Fixeffektmodell geht von einem einzigen wahren Effekt aus, der allen eingeschlossenen Studien zugrunde liegt. Die Variation zwischen beobachteten Effekten wird auf Zufallsfehler zurückgeführt. Hätten alle Studien unendliche Stichprobengrößen und keine Verzerrungen, würden identische Effektschätzungen resultieren. Unterschiede in Populationen, Interventionen oder Messmethoden werden als irrelevant angenommen. Die Fehlerterm basieren somit ausschließlich auf innerstudienbedingter Variation.

Ziel des Fixeffektmodells ist die Schätzung dieses gemeinsamen Effekts und dessen Unsicherheit. Es eignet sich, wenn Studien homogen im Design und Ergebnis sind oder die Variation zwischen Studien gering erscheint.

Ein Random-Effects-Modell betrachtet die eingeschlossenen Studien als Zufallsstichprobe einer hypothetischen Studienpopulation. Es nimmt an, dass die wahren Effekte zwischen Studien variieren. Selbst bei unendlicher Stichprobengröße würden Unterschiede bestehen bleiben, da z. B. Interventionseffekte variieren. Die beobachteten Effekte folgen einer Normalverteilung.

Das Modell berücksichtigt sowohl innerstudienbedingte als auch zwischenstudienbedingte Variation (Heterogenität). Statistische Tests auf Heterogenität prüfen die Nullhypothese gleicher Effekte. Ziel ist die Schätzung des mittleren Effekts über alle Studien – unabhängig vom Signifikanzniveau der Heterogenität.

Auswirkungen der Modellwahl

Präzision der Schätzung:
- Fixeffektmodelle ignorieren zwischenstudienbedingte Variation, sodass KI enger ausfallen.
- Random-Effects-Modelle produzieren breitere KI bei Heterogenität (Abbildung 1B).
Gewichtung der Studien:
- Fixeffektmodelle gewichten größere Studien stärker (da geringere Varianz).
- Random-Effects-Modelle gleichen Gewichte zwischen großen und kleinen Studien stärker an (Abbildung 1C). Kleinere Studien beeinflussen den gepoolten Effekt stärker.
Punktschätzer:
- Bei Heterogenität liegt der Punktschätzer im Random-Effects-Modell näher an den Ergebnissen kleinerer Studien (Abbildung 2C).

Praxisbeispiele

Geringe Heterogenität: In einer Meta-Analyse zu Calciumkanalblockern (CCB) vs. Betablockern (I² = 0%) liefern beide Modelle identische Ergebnisse (Abbildung 2A).
Moderate Heterogenität: Beim Vergleich von CCB mit ACE-Hemmern (I² = 45,5%) sind die Ergebnisse beider Modelle ähnlich (Abbildung 2B).
Hohe Heterogenität: In einer Meta-Analyse zu restriktiver vs. liberaler Transfusion bei Anämie und Myokardinfarkt (I² = 59,1%) unterscheiden sich die Modelle deutlich:
- Random-Effects-Modell: RR 1,61 (KI 0,38–6,88; p = 0,52).
- Fixeffektmodell: RR 0,99 (KI 0,59–1,65; p = 0,96).

Hier erhält die größte Studie (Ducrocq et al.) im Fixeffektmodell 92,62 % Gewicht, im Random-Effects-Modell jedoch nur 51,00 %.

Schlussfolgerung

Die Modellwahl sollte nicht allein auf Heterogenitätstests basieren. Bei geringer Variation sind die Ergebnisse beider Modelle vergleichbar. Bei Heterogenität liefern Random-Effects-Modelle konservativere Schätzungen. Kliniker müssen verstehen, wie die Gewichtung von Studien und die Berücksichtigung von Heterogenität die Interpretation beeinflussen – insbesondere bei widersprüchlichen Studienergebnissen.

doi.org/10.1097/CM9.0000000000002814