Оценщик максимального балла - Maximum score estimator - Wikipedia

В статистика и эконометрика, то оценщик максимальной оценки это непараметрический оценщик за дискретный выбор модели, разработанные Чарльз Мански в 1975 году. полиномиальный пробит и полиномиальный логит оценки, он не делает никаких предположений относительно распределение ненаблюдаемой части полезность. Однако его статистические свойства (особенно его асимптотическое распределение ) более сложны, чем полиномиальные пробит и логит модели, поэтому статистические выводы трудно. Чтобы решить эти проблемы, Джоэл Горовиц предложил вариант, названный оценщиком сглаженного максимального балла.

Параметр

При моделировании дискретный выбор проблемы, предполагается, что выбор определяется путем сравнения скрытой полезности.[1] Обозначим совокупность агентов как Т и общий выбор, установленный для каждого агента как C. Для агента , обозначим ее выбор как , который равен 1 при выборе я выбрано и 0 в противном случае. Предположим, что скрытая полезность линейна по независимым переменным, и существует дополнительная ошибка ответа. Тогда для агента ,

и

куда и являются q-мерные наблюдаемые ковариаты об агенте и выборе, и и факторы, влияющие на решение агента, которые эконометрист не учитывает. Построение наблюдаемых ковариат очень общее. Например, если C это набор разных марок кофе, то включает характеристики обоих агентов т, например возраст, пол, доход и этническая принадлежность, а также кофе я, например, цена, вкус, а также местный он или импортный. Предполагаются все условия ошибки i.i.d. и нам нужно оценить который характеризует влияние различных факторов на выбор агента.

Параметрические оценщики

Обычно на член ошибки накладывается какое-то конкретное предположение о распределении, так что параметр является оценивается параметрически. Например, если предполагается, что распределение ошибки является нормальным, то модель будет просто полиномиальный пробит модель;[2] если предполагается, что это Гамбель раздача, то модель становится полиномиальная логит-модель. В параметрическая модель [3] удобно для вычислений, но может и не быть последовательный после неправильного определения распределения члена ошибки.[4]

Двоичный ответ

Например, предположим, что C содержит только два предмета. Это скрытое представление полезности[5] из двоичный выбор модель. В этой модели выбор такой: , куда два вектора объясняющих ковариат, и i.i.d. ошибки ответа,

скрытая полезность выбора вариантов 1 и 2. Тогда журнал функция правдоподобия можно представить как:

Если наложено некоторое предположение о распределении ошибки ответа, то логарифмическая функция правдоподобия будет иметь представление в замкнутой форме.[2] Например, если предполагается, что ошибка ответа распределяется как: , то функцию правдоподобия можно переписать как:

куда это кумулятивная функция распределения (CDF) для стандарта нормальное распределение. Здесь, даже если не имеет представления в замкнутой форме, в отличие от его производной. Это пробит модель.

Эта модель основана на предположении распределения о члене ошибки ответа. Добавление в модель определенного предположения о распределении может сделать модель вычислительно управляемой из-за существования представления в замкнутой форме. Но если распределение ошибочного члена указано неправильно, оценки, основанные на предположении о распределении, будут несовместимы.

Основная идея модели без распределения состоит в том, чтобы заменить два вероятностных члена в логарифмической функции правдоподобия другими весами. Общая форма функции логарифма правдоподобия может быть записана как:

Оценщик максимального балла

Чтобы сделать оценку более устойчивой к предположению о распределении, Мански (1975) предложил непараметрическая модель оценить параметры. В этой модели обозначим количество элементов набора выбора как J, общее количество агентов как N, и представляет собой последовательность действительных чисел. Оценщик максимального балла [6] определяется как:

Здесь, это ранжирование части достоверности основной полезности выбора я. Интуиция в этой модели заключается в том, что чем выше рейтинг, тем больший вес будет иметь выбор.

При определенных условиях оценка максимальной оценки может быть слабый последовательный, но его асимптотические свойства очень сложны.[7] Эта проблема в основном возникает из-за не-гладкость целевой функции.

Двоичный пример

В двоичном контексте оценщик максимальной оценки может быть представлен как:

куда

и и - две константы из (0,1). Интуиция этой схемы взвешивания состоит в том, что вероятность выбора зависит от относительного порядка части достоверности полезности.

Сглаженная оценка максимального балла

Хоровиц (1992) предложил сглаженную оценку максимального балла (SMS), которая имеет гораздо лучшие асимптотические свойства.[8] Основная идея - заменить несглаженную весовую функцию со сглаженным. Определите плавный функция ядра K удовлетворяющие следующим условиям:

  1. ограничена над действительные числа
  2. и

Здесь функция ядра аналогична CDF, PDF которой симметричен относительно 0. Тогда оценка SMS определяется как:

куда последовательность строго положительных чисел и . Здесь интуиция такая же, как и при построении традиционной максимальной оценки: агент с большей вероятностью выберет вариант, который имеет более высокую наблюдаемую часть скрытой полезности. При определенных условиях сглаженная оценка максимального балла является согласованной и, что более важно, имеет асимптотическое нормальное распределение. Следовательно, все обычные статистические проверки и выводы, основанные на асимптотической нормальности, могут быть реализованы.[9]

Рекомендации

  1. ^ Дополнительные примеры см. В: Смит, Майкл Д. и Бриньолфссон, Эрик, «Принятие решений потребителями в интернет-магазине-роботе» (октябрь 2001 г.). Рабочий документ школы менеджмента им. Слоуна Массачусетского технологического института № 4206-01.
  2. ^ а б Вулдридж, Дж. (2002). Эконометрический анализ поперечных и панельных данных. Кембридж, Массачусетс: MIT Press. стр.457–460. ISBN  978-0-262-23219-7.
  3. ^ Конкретный пример см .: Тецуо Яй, Сэйдзи Ивакура, Сигеру Моричи, Мультиномиальный пробит со структурированной ковариацией для поведения выбора маршрута, Транспортные исследования, часть B: Методологические, том 31, выпуск 3, июнь 1997, страницы 195-207, ISSN 0191 -2615
  4. ^ Цзинь Ян (2012), «Сглаженная оценка максимального балла для полиномиальных моделей с дискретным выбором», рабочий документ.
  5. ^ Уокер, Джоан; Бен-Акива, Моше (2002). «Обобщенная случайная полезная модель». Математические социальные науки. 43 (3): 303–343. Дои:10.1016 / S0165-4896 (02) 00023-9.
  6. ^ Мански, Чарльз Ф. (1975). "Максимальный балл оценки стохастической полезной модели выбора". Журнал эконометрики. 3 (3): 205–228. CiteSeerX  10.1.1.587.6474. Дои:10.1016/0304-4076(75)90032-9.
  7. ^ Ким, Джанкён; Поллард, Дэвид (1990). "Кубическая асимптотика". Анналы статистики. 18 (1): 191–219. Дои:10.1214 / aos / 1176347498. JSTOR  2241541.
  8. ^ Горовиц, Джоэл Л. (1992). «Сглаженная оценка максимальной оценки для модели двоичного ответа». Econometrica. 60 (3): 505–531. Дои:10.2307/2951582. JSTOR  2951582.
  9. ^ Информацию об исследовании см. В: Jin Yan (2012), «Сглаженная оценка максимального балла для полиномиальных моделей дискретного выбора», Рабочий документ.

дальнейшее чтение