Смещение вследствие пропущенных переменных (англ. Omitted variable bias) — явление в регрессионном анализе, связанное с получением, смещённых и несостоятельных оценок регрессионных коэффициентов вследствие некорректной спецификации модели, а именно невключения в оцениваемую модель независимых переменных, оказывающих причинно-следственное влияние на зависимую переменную, или невозможности включить в неё некую ненаблюдаемую независимую переменную.
Формальный вывод
Представим, что истинная регрессионная модель выглядит следующим образом:
где — вектор отклика, и — матрица и вектор независимых переменных. При условии, что и , то оценки и соответственно будут МНК-оценками регрессионной зависимости отклика от независимых переменных. В частности, (где — объединённая матрица независимых переменных).
Чтобы смоделировать смещение вследствие пропущенных переменных, опустим предиктор , включив его в состав нескоррелированной с части модели:
где .
Тогда МНК-оценки коэффициентов при предикторах будут несостоятельны в сравнении с истинным коэффициентом :
Поскольку, согласно допущению изначальной модели, , то , тогда как
откуда .
Литература
- Cameron A. C., Trivedi P. K. Microeconometrics: methods and applications. – Cambridge university press, 2005. — 1034 p. — P. 92-93.
- Wooldridge J. M. Introductory Econometrics: A Modern Approach. – South-Western College Pub, 2002. — 819 p. — P. 87-92, 165-166.