Хорошая статистика - Well-behaved statistic

Хотя термин хорошая статистика часто используется в научной литературе примерно так же, как хорошо воспитанный в математика (то есть означать "непатологический "[1][2]) ему также может быть придано точное математическое значение, причем разными способами. В первом случае значение этого термина будет варьироваться от контекста к контексту. В последнем случае математические условия могут использоваться для получения классов комбинаций распределений со статистикой, которые хорошо воспитанный во всех смыслах.

Первое определение: В отклонение хорошо воспитанного статистический оценщик конечно и одно условие на его иметь в виду это то, что это дифференцируемый в оцениваемом параметре.[3]

Второе определение: Статистика монотонна, четко определена и локально достаточна.[4]

Условия для статистики правильного поведения: первое определение

Более формально условия можно выразить таким образом. это статистика для это функция образца, . За быть хорошо воспитанный мы требуем:

: Состояние 1

дифференцируемый в , а производная удовлетворяет:

: Условие 2

Условия для статистики правильного поведения: второе определение

Для вывода закона распределения параметра Т, совместим с , статистика должна соответствовать некоторым техническим характеристикам. А именно статистика s как говорят хорошо воспитанный если он удовлетворяет следующим трем утверждениям:

  1. монотонность. Равномерно монотонная связь существует между s и ? для любых фиксированных семян - чтобы иметь единственное решение (1);
  2. четко определенный. На каждом наблюдаемом s статистика четко определена для каждого значения?, т.е. для любой выборочной спецификации такой, что имеет плотность вероятности, отличную от 0 - чтобы избежать рассмотрения несюръективного отображения из к , т.е. связывая через к образцу а? который не смог сгенерировать сам образец;
  3. местная достаточность. составляет истинную выборку T для наблюдаемых s, так что каждому выбранному значению можно отнести одно и то же распределение вероятностей. Сейчас же, является решением (1) с затравкой . Поскольку семена распределены поровну, единственное предостережение исходит от их независимости или, наоборот, от их зависимости от? сам. Эта проверка может быть ограничена семенами, вовлеченными s, т.е. этого недостатка можно избежать, потребовав, чтобы распределение не зависит от?. Простой способ проверить это свойство - сопоставить спецификации начального числа с s спецификации. Отображение конечно зависит от?, Но распределение не будет зависеть от?, если указанная выше начальная независимость выполняется - условие, которое выглядит как местный достаточность статистики S.

Остальная часть данной статьи в основном посвящена контексту сбор данных процедуры, применяемые к статистические выводы и, в частности, к группе вычислительно интенсивных процедур, которые были названы алгоритмический вывод.

Алгоритмический вывод

В алгоритмический вывод, наиболее актуальным свойством статистики является шаг поворота, который позволяет перенести вероятностные соображения из выборочного распределения в распределение параметров, представляющих распределение населения таким образом, чтобы вывод из этого статистические выводы шаг совместим с фактически наблюдаемым образцом.

По умолчанию заглавные буквы (например, U, Икс) будем обозначать случайные величины и строчные буквы (ты, Икс) их соответствующие реализации и готическими буквами (такими как ) область, в которой переменная принимает спецификации. Лицом к образцу , учитывая механизм отбора проб , с скаляр, для случайной величины Икс, у нас есть

Механизм отбора проб , статистики s, как функция ? из со спецификациями в , имеет объясняющую функцию, определяемую основным уравнением:

для подходящих семян а параметр?

Пример

Например, как для Распределение Бернулли с параметром п и экспоненциальное распределение с параметром? статистика ведет себя хорошо. Удовлетворение трех вышеупомянутых свойств несложно, если посмотреть на обе объясняющие функции: если , 0 иначе в случае случайной величины Бернулли, и для экспоненциальной случайной величины, приводящей к статистике

и

Наоборот, в случае Икс после непрерывное равномерное распределение на та же статистика не соответствует второму требованию. Например, наблюдаемый образец дает. Но объясняющая функция этого Икс является . Следовательно, главное уравнение будет производить с U образец и решение . Это противоречит наблюдаемому образцу, поскольку первое наблюдаемое значение должно быть больше правого крайнего значения Икс классифицировать. Статистика в этом случае ведет себя хорошо.

Аналогично для случайной величины Икс после Распределение Парето с параметрами K и А (видеть Пример Парето для более подробной информации об этом случае),

и

можно использовать как общую статистику по этим параметрам.

В качестве общего утверждения, справедливого при слабых условиях, достаточная статистика хорошо себя ведут в отношении связанных параметров. В таблице ниже приведены достаточные / хорошие статистические данные для параметров некоторых из наиболее часто используемых распределений вероятностей.

Общие законы распределения вместе с соответствующей достаточной и корректной статистикой.
РаспределениеОпределение функции плотностиДостаточная / корректная статистика
Равномерное дискретное
Бернулли
Биномиальный
Геометрический
Пуассон
Равномерный непрерывный
Отрицательная экспонента
Парето
Гауссовский
Гамма

Рекомендации

  1. ^ Рассвет Якобуччи. «Посреднический анализ и категориальные переменные: последний рубеж» (PDF). Получено 7 февраля 2017.
  2. ^ Джон ДиНардо и Джейсон Уинфри. «Закон гениальности и хоумрана опровергнут» (PDF). Получено 7 февраля 2017.CS1 maint: использует параметр авторов (связь)
  3. ^ DasGupta. "(без названия)" (PDF). Получено 7 февраля 2017. Cite использует общий заголовок (помощь)
  4. ^ Аполлони, В; Bassis, S .; Malchiodi, D .; Витольд, П. (2008). Загадка гранулярных вычислений. Исследования в области вычислительного интеллекта. 138. Берлин: Springer.