Messfehler in der Multiplen Regression
Messfehler in multiplen Regressionen
Messfehler in multiplen Regressionen werden häufig
vernachlässigt. Das ist besonders problematisch, da die Methode der kleinsten
Quadrate eigentlich davon ausgeht, dass es in den Daten keinen Messfehler gibt.
Messfehler kann in abhängigen und unabhängigen Variablen vorliegen. Insbesondere kann Messfehler auf den Variablen zu einer Unterschätzung der Regressionskoeffizienten führen, also einer Abschwächung der geschätzten Zusammenhänge (sogenannter Attenuation Bias, z.B. Spearman, 1904).
Wenn in den unabhängigen Variablen Messfehler vorliegt, gibt es zusätzliche Probleme:
In der multiplen Regressionen kann Messfehler in mehreren Prädiktorvariablen auch zu einer systematischen Anhäufung von Alphafehlern führen, wenn die Prädiktorvariablen korreliert und messfehlerbehaftet sind (Shear et al., 2013).
Stellen wir uns eine multiple Regression vor, in der die Mathematikfähigkeit (AV/Kriterium) durch das räumliche Vorstellungsvermögen (UV1) vorhergesagt werden soll und für das Leseverstehen (UV2) kontrolliert wird. In dieser Regression könnten Messfehler dazu führen, dass räumliches Vorstellungsvermögen selbst dann ein signifikanter Prädiktor wird, wenn der gesamte Zusammenhang eigentlich nur durch das Leseverständnis zustande kommt.
Das liegt daran, dass durch Messfehler scheinbare Zusammenhänge zwischen Variablen erzeugt werden können. Dieses Problem tritt besonders dann auf, wenn die Prädiktorvariablen korreliert sind (Multikollinearität) oder mit zunehmender Stichprobengröße, größerem Zusammenhang zwischen Mathematikfähigkeit und Leseverstehen (Kriterium und Kontrollvariable) und höherer Reliabilität des Prädiktors für den nicht kontrolliert werden soll.
Wenn Messfehler in der Kontrollvariable ignoriert werden kann es zu bis zu 36% mehr Typ 1 Fehlern kommen (Shear et al., 2013). Effektgrößen (Regressionsgewichte) sind jedoch robuster gegen Messfehler in multiplen Regressionen.
Allgemein gesagt führt das nicht berücksichtigen der Messfehler zu falschen Rückschlüssen auf der Populationsebene.
Shear, Benjamin R.; Zumbo, Bruno D. (2013): False Positives in Multiple Regression. In: Educational and Psychological Measurement 73 (5), S. 733–756. DOI: 10.1177/0013164413487738.
Spearman C. (1904). The proof and measurement of association between two things. American Journal of Psychology, 15(1), 72-101.