Wie wähle ich meine Prädiktoren im LMM aus?
Hier findest du auch Infos zur R-Fehlermeldung "singular fit".
Zur Auswahl von Prädiktoren bei Multilevel-Modellen gibt es verschiedene Vorgehensweisen. Im Idealfall erfolgt sie theoriegeleitet.
Insbesondere sollten bei den Random Effects alle relevanten Random Intercepts ins Modell aufgenommen werden, zuzüglich Random Slopes für alle Effekte, wo man sehr sicher Personenunterschiede vermutet (Bspw. bei einer Zeitvariable) oder wo man einen Cross-Level-Interaktionsterm aufnehmen möchte. Ein vorgeschlagenes Vorgehen ist, alle möglichen random effects aufzunehmen und dann sukzessive diejenigen mit sehr hohen Korrelationen auszuschließen (Matuschek et al. 2017). Wenn man eine zu komplexe random effects Struktur hat (also zu viele), dann kommt es auch vor, dass das Modell gar nicht schätzbar ist (nicht konvergiert, Fehlermeldung "singular fit"). Dann sollte man auch random effects mit geringer Varianz oder sehr starker Korrelation entfernen. Alternativ kann man in solchen Fällen auch auf bayesianische Schätzmethoden zurückgreifen.
Bei den Fixed Effects sollte auch in erster Linie theoriegeleitet vorgegangen werden. Manchmal möchte man bei einer großen Auswahl an Prädiktoren aber auch datengetrieben vorgehen. Dabei ist es prinzipiell möglich, einfach das volle Modell mit allen Prädiktoren zu schätzen, oder mehrere plausible Modelle aufzustellen und mittels Informationskriterien (AIC, BIC) zu vergleichen. Die Auswahl von Prädiktoren auf Basis von der
p-Werte der Regressionsgewichte ist kein geeignetes Vorgehen (Burnham & Anderson 2004a und 2004b, Burnham et al., 2011).