Смешанный логит - Mixed logit

Смешанный логит является полностью общей статистической моделью для исследования дискретный выбор. Мотивация для модели смешанного логита проистекает из ограничений стандартной логит модель. Стандартная модель логита имеет три основных ограничения, которые решает смешанный логит: «Она устраняет три ограничения стандартного логита, допуская случайное изменение вкуса, неограниченные шаблоны замены и корреляцию ненаблюдаемых факторов во времени».[1] Смешанный логит также может использовать любое распределение для случайных коэффициентов, в отличие от пробита, который ограничен нормальным распределением. Было показано, что модель смешанного логита может аппроксимировать с любой степенью точности любую истинную случайную полезную модель дискретного выбора при условии соответствующей спецификации переменных и распределения коэффициентов ».[2]

Случайная вариация вкуса

«Вкусовые» коэффициенты стандартной логит-модели, или фиксированы, что означает одинаковы для всех. Смешанный логит имеет разные для каждого человека (т.е. каждого лица, принимающего решения).

В стандартной модели логита полезность человека n для альтернативы i равна:

с участием

~ iid экстремальное значение

Для модели смешанного логита эта спецификация обобщается, позволяя быть случайным. Полезность человека n для альтернативы i в модели смешанного логита:

с участием

~ iid экстремальное значение

где θ параметры распределения над генеральной совокупностью, например среднее и дисперсия .

При условии , вероятность того, что человек n выберет альтернативу i, является стандартной логит-формулой:

Однако, поскольку является случайным и неизвестным, (безусловная) вероятность выбора является интегралом этой логит-формулы по плотности .

Эта модель также называется моделью логита случайных коэффициентов, поскольку случайная величина. Это позволяет наклонам полезности (т. Е. Предельной полезности) быть случайными, что является продолжением модель случайных эффектов где только перехват был стохастическим.

Любые функция плотности вероятности можно указать для распределения коэффициентов в генеральной совокупности, т. е. для . Чаще всего используется обычный дистрибутив, в основном из-за его простоты. Для коэффициентов, которые принимают один и тот же знак для всех людей, таких как коэффициент цены, который обязательно отрицателен, или коэффициент желаемого атрибута, используются распределения с поддержкой только с одной стороны от нуля, такие как логнормальное.[3][4] Когда по логике коэффициенты не могут быть неограниченно большими или малыми, часто используются ограниченные распределения, такие как или треугольные распределения.

Неограниченные шаблоны замены

Модель смешанного логита может представлять общую схему замещения, поскольку она не демонстрирует ограничительных независимость от нерелевантных альтернатив (IIA) собственность. Процентное изменение вероятности для одной альтернативы при процентном изменении мАтрибут другой альтернативы

где β м это мй элемент .[1][4] Из этой формулы видно, что «сокращение на десять процентов для одной альтернативы не обязательно подразумевает (как в случае с логитом) уменьшение на десять процентов для каждой другой альтернативы».[1] Относительные проценты зависят от корреляции между вероятностью того, что респондент n выберет альтернативу i, L ni , и вероятность того, что респондент n выберет альтернативу j, L Нью-Джерси , по разным розыгрышам β.

Корреляция ненаблюдаемых факторов во времени

Стандартный logit не принимает во внимание какие-либо ненаблюдаемые факторы, которые сохраняются с течением времени для конкретного лица, принимающего решения. Это может быть проблемой, если вы используете панельные данные, которые представляют повторяющийся выбор с течением времени. Применяя стандартную логит-модель к панельным данным, вы делаете допущение, что ненаблюдаемые факторы, влияющие на выбор человека, являются новыми каждый раз, когда человек делает выбор. Это очень маловероятное предположение. Чтобы учесть как случайные вариации вкуса, так и корреляцию ненаблюдаемых факторов во времени, полезность для респондента n для альтернативы i в момент времени t определяется следующим образом:

где индекс t - измерение времени. Мы по-прежнему делаем логит-предположение, что является i.i.d крайним значением. Это означает, что независим во времени, людях и альтернативах. по сути, это просто белый шум. Однако корреляция во времени и по альтернативам возникает из общего эффекта , которые вводят полезность в каждый период времени и для каждой альтернативы.

Чтобы исследовать корреляцию явно, предположим, что β обычно распределяются со средним и дисперсия . Тогда полезность уравнение становится:

и η является ничьей из стандартной нормальной плотности. После перестановки уравнение становится:

где ненаблюдаемые факторы собраны в . Из ненаблюдаемых факторов, не зависит от времени, и не является независимым во времени или альтернативах.

Тогда ковариация между альтернативами и является,

и ковариация между временем и является

Задавая X соответствующим образом, можно получить любой образец ковариации во времени и альтернативы.

При условии , вероятность последовательности выборов, сделанных человеком, - это просто произведение логит-вероятности каждого индивидуального выбора этого человека:

поскольку не зависит от времени. Тогда (безусловная) вероятность последовательности выборов - это просто интеграл этого произведения логитов по плотности .

Моделирование

К сожалению, нет закрытой формы для интеграла, который входит в вероятность выбора, и поэтому исследователь должен моделировать Pп. К счастью для исследователя, моделируя Pп может быть очень простым. Необходимо выполнить четыре основных шага

1. Воспользуйтесь функцией плотности вероятности, которую вы указали для «вкусовых» коэффициентов. То есть взять ничью из и обозначьте розыгрыш , для представляющий первый розыгрыш.

2. Рассчитайте . (Условная вероятность.)

3. Повторите много раз, .

4. Усредните результаты.

Тогда формула для моделирования будет выглядеть следующим образом:

где R - общее количество розыгрышей, взятых из раздачи, а r - одна розыгрыш.

Как только это будет сделано, у вас будет значение вероятности каждой альтернативы i для каждого респондента n.

Смотрите также

дальнейшее чтение

использованная литература