Kausalität ist ein sehr vielschichtiges Thema und wir werden hier nur ein paar Grundlagen anreißen. Kausalität besagt ganz grundlegend, dass eine Veränderung in einem Merkmal X auf eine Veränderung im Merkmal Y verursacht. Um das festzustellen, führen wir häufig, wenn umsetzbar, Experimente durch. Hierbei muss sichergestellt werden, dass es keine Konfundierungsvariablen gibt, die X auch beeinflussen könnten.

Neben Konfundierungsvariablen gibt es noch andere Arten von Drittvariablen, hier der Überblick. Wir interessieren uns in dem Beispiel für eine Regression von Y auf X, C ist die Drittvariable:

  • Ein Confounder ist eine Variable, die sowohl A als auch B beeinflusst (X←C→Y), also wo C sowohl X als auch Y beeinflusst.
  • Ein Mediator ist eine Variable, die den kausalen Pfad zwischen A und B vermittelt (X→C→Y), also X beeinflusst C und C dann wiederum Y.
  • Ein Collider C ist eine spezielle Konstellation in einem kausalen Diagramm, bei der zwei kausale Pfade auf einen gemeinsamen Knoten treffen (X→C←Y), also X und Y beide C beeinflussen. Ein Beispiel gibt es hier.

Jedes statistische Modell trifft implizite oder explizite Annahmen darüber, wie Drittvariablen behandelt werden. Zum Beispiel geht eine multiple Regression typischerweise davon aus, dass andere Prädiktoren im Modell als Confounder wirken. Wenn jedoch ein Collider irrtümlicherweise wie ein Confounder behandelt wird, können sich die Schätzer aller Variablen verändern. Dies macht es besonders wichtig, die Rolle von Drittvariablen im Modell sorgfältig theoretisch zu evaluieren.

Um zum Beispiel mediierte Zusammenhänge zu spezifizieren, kann man Strukturgleichungs- oder Pfadmodelle nutzen (Inhalt im Master).

Generell gilt jedoch, dass der Goldstandard für kausale Inferenzen nicht das statistische Kontrollieren für Störeinflüsse (Confounder) ist, sondern das versuchsplanerische Ausschließen systematischer Verzerrungen durch randomisierte kontrollierte Studien (RCTs). Durch die zufällige Zuordnung der Versuchspersonen zu den Versuchsbedingungen sollte jedes Merkmal, das die Versuchspersonen betrifft, in allen Gruppen gleich häufig auftreten. Somit wären die Störeinflüsse in beiden Gruppen gleich verteilt, und ein Unterschied zwischen den Gruppen könnte nur noch auf die Versuchsbedingung zurückgeführt werden.

Dabei gibt es jedoch verschiedene Hürden: In manchen Studien wäre eine randomisierte Zuweisung ethisch nicht vertretbar, oder es könnten Verzerrungen auftreten, wenn der Versuchsleiter oder die Versuchsperson weiß, in welcher Bedingung sie sich befindet. Letzteres kann durch durch doppelt verblindete Studien gelöst werden, welche in der Psychologie häufig schwer umsetzbar sind. In solchen Fällen kann man auf andere versuchsplanerische Methoden (z.B. diskontinuierliches Regressionsdesign) oder statistische Methoden (z.B. Propensity-Score Matching) zurückzugreifen (Inhalte im Master).

Döring, N. & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften. Springer. (S. 741 f.)

Gollwitzer, M., Pohl, S., & Jäger, R. S. (2023). Evaluation kompakt: Mit Online-Material (3. Auflage). Julius Beltz GmbH & Co. KG.

Zuletzt geändert: Montag, 13. Januar 2025, 16:47