Смешанный логит - Mixed logit

Смешанный логит является полностью общей статистической моделью для исследования дискретный выбор. Мотивация для модели смешанного логита проистекает из ограничений стандартной логит модель. Стандартная модель логита имеет три основных ограничения, которые решает смешанный логит: «Она устраняет три ограничения стандартного логита, допуская случайное изменение вкуса, неограниченные шаблоны замены и корреляцию ненаблюдаемых факторов во времени».^[1] Смешанный логит также может использовать любое распределение для случайных коэффициентов, в отличие от пробита, который ограничен нормальным распределением. Было показано, что модель смешанного логита может аппроксимировать с любой степенью точности любую истинную случайную полезную модель дискретного выбора при условии соответствующей спецификации переменных и распределения коэффициентов ».^[2]

Случайная вариация вкуса

«Вкусовые» коэффициенты стандартной логит-модели, или ${displaystyle eta}$ фиксированы, что означает ${displaystyle eta}$ одинаковы для всех. Смешанный логит имеет разные ${displaystyle eta}$ для каждого человека (т.е. каждого лица, принимающего решения).

В стандартной модели логита полезность человека n для альтернативы i равна:

{displaystyle U_ {ni} = eta x_ {ni} + varepsilon _ {ni}}

с участием

{displaystyle varepsilon _ {ni}}

~ iid экстремальное значение

Для модели смешанного логита эта спецификация обобщается, позволяя ${displaystyle eta _ {n}}$ быть случайным. Полезность человека n для альтернативы i в модели смешанного логита:

{displaystyle U_ {ni} = eta _ {n} x_ {ni} + varepsilon _ {ni}}

с участием

{displaystyle varepsilon _ {ni}}

~ iid экстремальное значение

{displaystyle quad eta _ {n} sim f (eta | heta)}

где θ параметры распределения ${displaystyle eta _ {n}}$ над генеральной совокупностью, например среднее и дисперсия ${displaystyle eta _ {n}}$ .

При условии ${displaystyle eta _ {n}}$ , вероятность того, что человек n выберет альтернативу i, является стандартной логит-формулой:

{displaystyle L_ {ni} (eta _ {n}) = {frac {e ^ {eta _ {n} X_ {ni}}} {sum _ {j} e ^ {eta _ {n} X_ {nj}} }}}

Однако, поскольку ${displaystyle eta _ {n}}$ является случайным и неизвестным, (безусловная) вероятность выбора является интегралом этой логит-формулы по плотности ${displaystyle eta _ {n}}$ .

{displaystyle P_ {ni} = int L_ {ni} (eta) f (eta | heta) d eta}

Эта модель также называется моделью логита случайных коэффициентов, поскольку ${displaystyle eta _ {n}}$ случайная величина. Это позволяет наклонам полезности (т. Е. Предельной полезности) быть случайными, что является продолжением модель случайных эффектов где только перехват был стохастическим.

Любые функция плотности вероятности можно указать для распределения коэффициентов в генеральной совокупности, т. е. для ${displaystyle f (eta | heta)}$ . Чаще всего используется обычный дистрибутив, в основном из-за его простоты. Для коэффициентов, которые принимают один и тот же знак для всех людей, таких как коэффициент цены, который обязательно отрицателен, или коэффициент желаемого атрибута, используются распределения с поддержкой только с одной стороны от нуля, такие как логнормальное.^[3]^[4] Когда по логике коэффициенты не могут быть неограниченно большими или малыми, часто используются ограниченные распределения, такие как ${displaystyle S_ {b}}$ или треугольные распределения.

Неограниченные шаблоны замены

Модель смешанного логита может представлять общую схему замещения, поскольку она не демонстрирует ограничительных независимость от нерелевантных альтернатив (IIA) собственность. Процентное изменение вероятности для одной альтернативы при процентном изменении мАтрибут другой альтернативы

{displaystyle E_ {nix_ {nj} ^ {m}} = - {frac {x_ {nj} ^ {m}} {P_ {ni}}} int eta ^ {m} L_ {ni} (eta) L_ {nj } (eta) f (eta) d eta = -x_ {nj} ^ {m} int eta ^ {m} L_ {nj} (eta) {frac {L_ {ni} (eta)} {P_ {ni}} } f (eta) d eta}

где β ^м это мй элемент ${displaystyle eta}$ .^[1]^[4] Из этой формулы видно, что «сокращение на десять процентов для одной альтернативы не обязательно подразумевает (как в случае с логитом) уменьшение на десять процентов для каждой другой альтернативы».^[1] Относительные проценты зависят от корреляции между вероятностью того, что респондент n выберет альтернативу i, L _ni, и вероятность того, что респондент n выберет альтернативу j, L _{Нью-Джерси}, по разным розыгрышам β.

Корреляция ненаблюдаемых факторов во времени

Стандартный logit не принимает во внимание какие-либо ненаблюдаемые факторы, которые сохраняются с течением времени для конкретного лица, принимающего решения. Это может быть проблемой, если вы используете панельные данные, которые представляют повторяющийся выбор с течением времени. Применяя стандартную логит-модель к панельным данным, вы делаете допущение, что ненаблюдаемые факторы, влияющие на выбор человека, являются новыми каждый раз, когда человек делает выбор. Это очень маловероятное предположение. Чтобы учесть как случайные вариации вкуса, так и корреляцию ненаблюдаемых факторов во времени, полезность для респондента n для альтернативы i в момент времени t определяется следующим образом:

{displaystyle U_ {nit} = eta _ {n} X_ {nit} + varepsilon _ {nit}}

где индекс t - измерение времени. Мы по-прежнему делаем логит-предположение, что ${displaystyle varepsilon}$ является i.i.d крайним значением. Это означает, что ${displaystyle varepsilon}$ независим во времени, людях и альтернативах. ${displaystyle varepsilon}$ по сути, это просто белый шум. Однако корреляция во времени и по альтернативам возникает из общего эффекта ${displaystyle eta}$ , которые вводят полезность в каждый период времени и для каждой альтернативы.

Чтобы исследовать корреляцию явно, предположим, что β обычно распределяются со средним ${displaystyle {ar {eta}}}$ и дисперсия ${displaystyle sigma ^ {2}}$ . Тогда полезность уравнение становится:

{displaystyle U_ {nit} = ({ar {eta}} + sigma eta _ {n}) X_ {nit} + varepsilon _ {nit}}

и η является ничьей из стандартной нормальной плотности. После перестановки уравнение становится:

{displaystyle U_ {nit} = {ar {eta}} X_ {nit} + (sigma eta _ {n} X_ {nit} + varepsilon _ {nit})}

{displaystyle U_ {nit} = {ar {eta}} X_ {nit} + e_ {nit}}

где ненаблюдаемые факторы собраны в ${displaystyle e_ {nit} = sigma eta _ {n} X_ {nit} + varepsilon _ {nit}}$ . Из ненаблюдаемых факторов, ${displaystyle varepsilon _ {nit}}$ не зависит от времени, и ${displaystyle sigma eta _ {n} X_ {nit}}$ не является независимым во времени или альтернативах.

Тогда ковариация между альтернативами ${displaystyle i}$ и ${displaystyle j}$ является,

{displaystyle Cov (e_ {nit}, e_ {njt}) = sigma ^ {2} (X_ {nit} X_ {njt})}

и ковариация между временем ${displaystyle t}$ и ${displaystyle q}$ является

{displaystyle Cov (e_ {nit}, e_ {niq}) = sigma ^ {2} (X_ {nit} X_ {niq})}

Задавая X соответствующим образом, можно получить любой образец ковариации во времени и альтернативы.

При условии ${displaystyle eta _ {n}}$ , вероятность последовательности выборов, сделанных человеком, - это просто произведение логит-вероятности каждого индивидуального выбора этого человека:

{displaystyle L_ {n} (eta _ {n}) = prod _ {t} {frac {e ^ {eta _ {n} X_ {nit}}} {sum _ {j} e ^ {eta _ {n} X_ {njt}}}}}

поскольку ${displaystyle varepsilon _ {nit}}$ не зависит от времени. Тогда (безусловная) вероятность последовательности выборов - это просто интеграл этого произведения логитов по плотности ${displaystyle eta}$ .

{displaystyle P_ {ni} = int L_ {n} (eta) f (eta | heta) d eta}

Моделирование

К сожалению, нет закрытой формы для интеграла, который входит в вероятность выбора, и поэтому исследователь должен моделировать P_п. К счастью для исследователя, моделируя P_п может быть очень простым. Необходимо выполнить четыре основных шага

1. Воспользуйтесь функцией плотности вероятности, которую вы указали для «вкусовых» коэффициентов. То есть взять ничью из ${displaystyle f (eta | heta)}$ и обозначьте розыгрыш ${displaystyle eta ^ {r}}$ , для ${displaystyle r = 1}$ представляющий первый розыгрыш.