Zur Auswahl von Prädiktoren bei Multilevel-Modellen gibt es verschiedene Vorgehensweisen. Im Idealfall erfolgt sie theoriegeleitet.

Insbesondere sollten bei den Random Effects alle relevanten Random Intercepts ins Modell aufgenommen werden, zuzüglich Random Slopes für alle Effekte, wo man sehr sicher Personenunterschiede vermutet (Bspw. bei einer Zeitvariable) oder wo man einen Cross-Level-Interaktionsterm aufnehmen möchte. Ein vorgeschlagenes Vorgehen ist, alle möglichen random effects aufzunehmen und dann sukzessive diejenigen mit sehr hohen Korrelationen auszuschließen (Matuschek et al. 2017). Wenn man eine zu komplexe random effects Struktur hat (also zu viele), dann kommt es auch vor, dass das Modell gar nicht schätzbar ist (nicht konvergiert, Fehlermeldung "singular fit"). Dann sollte man auch random effects mit geringer Varianz oder sehr starker Korrelation entfernen. Alternativ kann man in solchen Fällen auch auf bayesianische Schätzmethoden zurückgreifen.

Bei den Fixed Effects sollte auch in erster Linie theoriegeleitet vorgegangen werden. Manchmal möchte man bei einer großen Auswahl an Prädiktoren aber auch datengetrieben vorgehen. Dabei ist es prinzipiell möglich, einfach das volle Modell mit allen Prädiktoren zu schätzen, oder mehrere plausible Modelle aufzustellen und mittels Informationskriterien (AIC, BIC) zu vergleichen. Die Auswahl von Prädiktoren auf Basis von der p-Werte der Regressionsgewichte ist kein geeignetes Vorgehen (Burnham & Anderson 2004a und 2004b, Burnham et al., 2011).

Wichtig ist, dass die Konfidenzintervalle und p-Werte der Regressionsgewichte des durch die Modellwahl gefundenen Modells grundsätzlich nicht mehr interpretiert werden dürfen (siehe z.B. Huang, 2019, Kuchibhotla et al, 2022). (Wenn man Konfidenzintervalle und p-Werte möchte, kann man das Modell natürlich nochmal an einem neuen Datensatz testen.)

Insbesondere ist auch die Auswahl von Prädiktoren auf Basis von der p-Werte der Regressionsgewichte kein geeignetes Vorgehen (sie sind nicht gut darin, die wahren Prädiktoren zu identifizieren, Burnham & Anderson 2004a und 2004b, Burnham et al., 2011).

Modifié le: vendredi 22 novembre 2024, 11:57