Оценщик максимального балла

В статистика и эконометрика, то оценщик максимальной оценки это непараметрический оценщик за дискретный выбор модели, разработанные Чарльз Мански в 1975 году. полиномиальный пробит и полиномиальный логит оценки, он не делает никаких предположений относительно распределение ненаблюдаемой части полезность. Однако его статистические свойства (особенно его асимптотическое распределение ) более сложны, чем полиномиальные пробит и логит модели, поэтому статистические выводы трудно. Чтобы решить эти проблемы, Джоэл Горовиц предложил вариант, названный оценщиком сглаженного максимального балла.

Параметр

При моделировании дискретный выбор проблемы, предполагается, что выбор определяется путем сравнения скрытой полезности.^[1] Обозначим совокупность агентов как Т и общий выбор, установленный для каждого агента как C. Для агента ${ displaystyle t in T}$ , обозначим ее выбор как ${ Displaystyle у_ {т, я}}$ , который равен 1 при выборе я выбрано и 0 в противном случае. Предположим, что скрытая полезность линейна по независимым переменным, и существует дополнительная ошибка ответа. Тогда для агента ${ displaystyle t in T}$ ,

{ displaystyle y_ {t, i} = 1 leftrightarrow x_ {t, i} beta + epsilon _ {t, i}> x_ {t, j} beta + epsilon _ {t, j}, forall j neq i}

и

{ displaystyle j in C}

куда ${ displaystyle x_ {t, i}}$ и ${ displaystyle x_ {t, j}}$ являются q-мерные наблюдаемые ковариаты об агенте и выборе, и ${ displaystyle epsilon _ {т, я}}$ и ${ displaystyle epsilon _ {т, j}}$ факторы, влияющие на решение агента, которые эконометрист не учитывает. Построение наблюдаемых ковариат очень общее. Например, если C это набор разных марок кофе, то ${ Displaystyle х_ {т, я}}$ включает характеристики обоих агентов т, например возраст, пол, доход и этническая принадлежность, а также кофе я, например, цена, вкус, а также местный он или импортный. Предполагаются все условия ошибки i.i.d. и нам нужно оценить ${ displaystyle beta}$ который характеризует влияние различных факторов на выбор агента.

Параметрические оценщики

Обычно на член ошибки накладывается какое-то конкретное предположение о распределении, так что параметр ${ displaystyle beta}$ является оценивается параметрически. Например, если предполагается, что распределение ошибки является нормальным, то модель будет просто полиномиальный пробит модель;^[2] если предполагается, что это Гамбель раздача, то модель становится полиномиальная логит-модель. В параметрическая модель ^[3] удобно для вычислений, но может и не быть последовательный после неправильного определения распределения члена ошибки.^[4]

Двоичный ответ

Например, предположим, что C содержит только два предмета. Это скрытое представление полезности^[5] из двоичный выбор модель. В этой модели выбор такой: ${ Displaystyle Y_ {t} = 1 [X_ {1, t} beta + varepsilon _ {1}> X_ {2, t} beta + varepsilon _ {2}]}$ , куда ${ Displaystyle X_ {1, t}, X_ {2, t}}$ два вектора объясняющих ковариат, ${ displaystyle varepsilon _ {1}}$ и ${ displaystyle varepsilon _ {2}}$ i.i.d. ошибки ответа,

{ displaystyle X_ {1, t} beta + varepsilon _ {1} { text {and}} X_ {2, t} beta + varepsilon _ {2}}

скрытая полезность выбора вариантов 1 и 2. Тогда журнал функция правдоподобия можно представить как:

{ Displaystyle Q = сумма _ {я-1} ^ {N} Y_ {t} log (P [X_ {1, t} beta -X_ {2, t} beta> varepsilon _ {2} - varepsilon _ {1}]) + (1-Y_ {t}) log (1-P [X_ {1, t} beta -X_ {2, t} beta> varepsilon _ {2} - varepsilon _ {1}])}

Если наложено некоторое предположение о распределении ошибки ответа, то логарифмическая функция правдоподобия будет иметь представление в замкнутой форме.^[2] Например, если предполагается, что ошибка ответа распределяется как: ${ Displaystyle N (0, sigma ^ {2})}$ , то функцию правдоподобия можно переписать как:

{ Displaystyle Q = сумма _ {я-1} ^ {N} Y_ {t} log left ( Phi left [{ frac {X_ {1, t} beta -X_ {2, t} beta} { surd 2 sigma}} right] right) + (1-Y_ {t}) log left ( Phi left [{ frac {X_ {2, t} beta -X_ {1, t} beta} { surd 2 sigma}} right] right)}

куда ${ displaystyle Phi}$ это кумулятивная функция распределения (CDF) для стандарта нормальное распределение. Здесь, даже если ${ displaystyle Phi}$ не имеет представления в замкнутой форме, в отличие от его производной. Это пробит модель.

Эта модель основана на предположении распределения о члене ошибки ответа. Добавление в модель определенного предположения о распределении может сделать модель вычислительно управляемой из-за существования представления в замкнутой форме. Но если распределение ошибочного члена указано неправильно, оценки, основанные на предположении о распределении, будут несовместимы.

Основная идея модели без распределения состоит в том, чтобы заменить два вероятностных члена в логарифмической функции правдоподобия другими весами. Общая форма функции логарифма правдоподобия может быть записана как:

{ Displaystyle Q = сумма _ {я-1} ^ {N} Y_ {t} cdot log (W_ {1} (X_ {1, t} beta, X_ {2, t} beta)) + (1-Y_ {t}) log (W_ {0} (X_ {1, t} beta, X_ {2, t} beta))}

Чтобы сделать оценку более устойчивой к предположению о распределении, Мански (1975) предложил непараметрическая модель оценить параметры. В этой модели обозначим количество элементов набора выбора как J, общее количество агентов как N, и ${ Displaystyle W (J-1)> W (J-2)> точки> W (1)> W (0)}$ представляет собой последовательность действительных чисел. Оценщик максимального балла ^[6] определяется как:

{ displaystyle { hat {b}} = { operatorname {arg max}} _ {b} { frac {1} {N}} sum _ {t = 1} ^ {N} sum _ { i = 1} ^ {J} y_ {t, i} W ( sum nolimits _ {j in C, j neq i} 1 (x_ {t, i} b> x_ {t, j} b) )}

Здесь, ${ displaystyle textstyle sum nolimits _ {j in C, j neq i} 1 (x_ {t, i} b> x_ {t, j} b)}$ это ранжирование части достоверности основной полезности выбора я. Интуиция в этой модели заключается в том, что чем выше рейтинг, тем больший вес будет иметь выбор.

При определенных условиях оценка максимальной оценки может быть слабый последовательный, но его асимптотические свойства очень сложны.^[7] Эта проблема в основном возникает из-за не-гладкость целевой функции.

Двоичный пример

В двоичном контексте оценщик максимальной оценки может быть представлен как:

{ Displaystyle W_ {1} (X_ {1, t} beta, X_ {2, t} beta) = w_ {1} [X_ {1, t} beta -X_ {2, t} beta> 0] + w_ {0} 1 [X_ {1, t} beta -X_ {2, t} beta <0],}

куда

{ Displaystyle W_ {0} (X_ {1, t} beta, X_ {2, t} beta) = 1-W_ {1} (X_ {1, t} beta, X_ {2, t} бета)}

и ${ displaystyle w_ {1}}$ и ${ displaystyle w_ {0}}$ - две константы из (0,1). Интуиция этой схемы взвешивания состоит в том, что вероятность выбора зависит от относительного порядка части достоверности полезности.

Сглаженная оценка максимального балла

Хоровиц (1992) предложил сглаженную оценку максимального балла (SMS), которая имеет гораздо лучшие асимптотические свойства.^[8] Основная идея - заменить несглаженную весовую функцию ${ Displaystyle textstyle W ( сумма nolimits _ {j in C, j neq i} 1 (x_ {t, i} b> x_ {t, j} b))}$ со сглаженным. Определите плавный функция ядра K удовлетворяющие следующим условиям:

${ Displaystyle | К ( cdot) |}$ ограничена над действительные числа
${ Displaystyle lim _ {и к - infty} К (и) = 0}$ и ${ Displaystyle lim _ {и к + infty} К (и) = 1}$
${ displaystyle { dot {K}} (u) = { dot {K}} (- u)}$

Здесь функция ядра аналогична CDF, PDF которой симметричен относительно 0. Тогда оценка SMS определяется как:

{ displaystyle { hat {b}} _ {SMS} = { operatorname {arg max}} _ {b} { frac {1} {N}} sum _ {t = 1} ^ {N} sum _ {i = 1} ^ {J} y_ {t, i} sum nolimits _ {j in C, j neq i} K (X_ {t, i} b-x_ {t, j} б / ч_ {N})}

куда ${ displaystyle (h_ {N}, N = 1,2, ...)}$ последовательность строго положительных чисел и ${ displaystyle lim _ {N to + infty} h_ {N} = 0}$ . Здесь интуиция такая же, как и при построении традиционной максимальной оценки: агент с большей вероятностью выберет вариант, который имеет более высокую наблюдаемую часть скрытой полезности. При определенных условиях сглаженная оценка максимального балла является согласованной и, что более важно, имеет асимптотическое нормальное распределение. Следовательно, все обычные статистические проверки и выводы, основанные на асимптотической нормальности, могут быть реализованы.^[9]

дальнейшее чтение

Мански, Чарльз Ф. (1985). «Полупараметрический анализ дискретного ответа: асимптотические свойства оценщика максимального балла». Журнал эконометрики. 27 (3): 313–333. Дои:10.1016/0304-4076(85)90009-0. ISSN 0304-4076.
Ньюи, Уитни К .; Макфадден, Дэниел (1994). «Глава 36. Оценка большой выборки и проверка гипотез». Справочник по эконометрике. Эльзевир. Дои:10.1016 / с1573-4412 (05) 80005-4. ISBN 978-0-444-88766-5. ISSN 1573-4412.CS1 maint: ref = harv (связь)

[1] Дополнительные примеры см. В: Смит, Майкл Д. и Бриньолфссон, Эрик, «Принятие решений потребителями в интернет-магазине-роботе» (октябрь 2001 г.). Рабочий документ школы менеджмента им. Слоуна Массачусетского технологического института № 4206-01.

[Wooldridge_457-2] а ^б Вулдридж, Дж. (2002). Эконометрический анализ поперечных и панельных данных. Кембридж, Массачусетс: MIT Press. стр.457–460. ISBN 978-0-262-23219-7.

[3] Конкретный пример см .: Тецуо Яй, Сэйдзи Ивакура, Сигеру Моричи, Мультиномиальный пробит со структурированной ковариацией для поведения выбора маршрута, Транспортные исследования, часть B: Методологические, том 31, выпуск 3, июнь 1997, страницы 195-207, ISSN 0191 -2615

[4] Цзинь Ян (2012), «Сглаженная оценка максимального балла для полиномиальных моделей с дискретным выбором», рабочий документ.

[5] Уокер, Джоан; Бен-Акива, Моше (2002). «Обобщенная случайная полезная модель». Математические социальные науки. 43 (3): 303–343. Дои:10.1016 / S0165-4896 (02) 00023-9.

[6] Мански, Чарльз Ф. (1975). "Максимальный балл оценки стохастической полезной модели выбора". Журнал эконометрики. 3 (3): 205–228. CiteSeerX 10.1.1.587.6474. Дои:10.1016/0304-4076(75)90032-9.

[7] Ким, Джанкён; Поллард, Дэвид (1990). "Кубическая асимптотика". Анналы статистики. 18 (1): 191–219. Дои:10.1214 / aos / 1176347498. JSTOR 2241541.

[8] Горовиц, Джоэл Л. (1992). «Сглаженная оценка максимальной оценки для модели двоичного ответа». Econometrica. 60 (3): 505–531. Дои:10.2307/2951582. JSTOR 2951582.

[9] Информацию об исследовании см. В: Jin Yan (2012), «Сглаженная оценка максимального балла для полиномиальных моделей дискретного выбора», Рабочий документ.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

Оценщик максимального балла - Maximum score estimator - Wikipedia

Содержание

Параметр

Параметрические оценщики

Двоичный ответ