Фиктивная переменная

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков, принимающих два значения, но и несколько возможных. В этом случае добавляются несколько фиктивных переменных. Фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой подвыборке. Последнее можно использовать для обнаружения структурных изменений.

Моделирование бинарной переменной[править | править вики-текст]

Пусть необходимо определить влияние некоторой качественной переменной z, принимающей два возможных значения. Обозначим эти возможные значения A и B для определенности. Тогда такой переменной можно поставить в соответствие следующую фиктивную переменную

Пусть исходная модель имеет вид

Если добавить переменную d в модель, то получим

Тогда при значимом коэффициенте при d получаем две модели для разных значений качественного признака, различающиеся на фиксированный сдвиг (разная константа):

Однако, качественный признак может влиять и на параметры зависимости от факторов x. В этом случае необходимо строить модель:

Таким образом, здесь в модели участвует не только переменная d, но и переменная dx. Это позволяет строить потенциально две разные модели для разных значений качественного признака:

Моделирование многозначного качественного признака[править | править вики-текст]

Пусть имеется признак, который принимает несколько возможных значений. Общее правило введения фиктивных переменных следующее: общее количество фиктивных переменных должно быть на единицу меньше количества возможных значений качественного признака, если в модели имеется константа. Это необходимо, чтобы не возникла проблема полной коллинеарности переменных.

Например, уровень образования: нет образования, среднее образование, высшее образование, ученая степень и т. д. В этом случае каждому уровню образования, кроме уровня «нет образования» можно поставить в соответствие некоторую фиктивную переменную.

Фиктивные переменные взаимодействия[править | править вики-текст]

Пусть в модели (например, средней заработной платы) участвуют две фиктивные переменные, отвечающие, например, за пол и наличие высшего образования. При обычном включении этих переменных в модель каждая из них дает определенный вклад в изменение коэффициентов модели. Однако, сумма эффектов пола и образования вообще говоря может быть не равна суммарному эффекту этих двух факторов, действующих одновременно. То есть наличие высшего образования у мужчин и у женщин вообще говоря по разному может отражаться на доходе. Поэтому наряду с фиктивными переменными пола и образования можно использовать фиктивную переменную взаимодействия:

Таким образом, данная переменная равна 1, например, для мужчин с высшим образованием и равна нулю для всех остальных случаев (мужчин без высшего образования и женщин независимо от уровня образования).

См. также[править | править вики-текст]

Литература[править | править вики-текст]

  • Gujarati, D. N. (2003). Basic econometrics. McGraw Hill. p. 1002.
  • Draper, N. R., Smith, H. (1998) Applied Regression Analysis, Wiley (Chapter 14)
  • Wooldridge, J. M. (2009). Introductory econometrics: a modern approach. Cengage Learning. p. 865.
  • Suits, D. B. (1957). "Use of Dummy Variables in Regression Equations". Journal of the American Statistical Association. 52 (280): 548–551.
  • Barreto, H., Howland, F. (2005). "Chapter 22: Dummy Dependent Variable Models". Introductory Econometrics: Using Monte Carlo Simulation with Microsoft Excel. Cambridge University Press.
  • Maddala, G. S. (1992). Introduction to econometrics. Macmillan Pub. Co. p. 631.