Т-статистика - T-statistic

В статистика, то т-статистический - это отношение отклонения оценочного значения параметра от его предполагаемого значения к его стандартная ошибка. Он используется в проверка гипотезы через Студенты т-тест. T-статистика используется в T-тесте, чтобы определить, следует ли вам поддерживать или отклонять нулевую гипотезу. Он очень похож на Z-оценка но с той разницей, что T-статистика используется, когда размер выборки невелик или стандартное отклонение генеральной совокупности неизвестно. Например, T-статистика используется для оценки Средняя численность населения из выборочное распределение из образец означает если население стандартное отклонение неизвестно. Он также используется вместе с p-значение при запуске проверки гипотез, где p-значение говорит нам, каковы шансы того, что результаты получатся.

Определение и особенности

Позволять быть оценщик параметра β в некоторых статистическая модель. Затем т-статистикой для этого параметра является любое количество вида

куда β0 - неслучайная известная константа, которая может совпадать или не совпадать с фактическим неизвестным значением параметра β, и это стандартная ошибка оценщика за β.

По умолчанию отчеты статистических пакетов т-статистический с β0 = 0 (эти т-статистика используется для проверки значимости соответствующего регрессора). Однако когда т-статистика необходима для проверки гипотезы о форме ЧАС0: β = β0, то ненулевое β0 может быть использовано.

Если является обыкновенный метод наименьших квадратов оценщик в классическом модель линейной регрессии (то есть с нормально распределенный и гомоскедастический условия ошибки), и если истинное значение параметра β равно β0, то выборочное распределение из т-статистический Студенты т-распределение с (п - к) степени свободы, где п - количество наблюдений, а k количество регрессоров (включая перехват)[нужна цитата ].

В большинстве моделей оценщик является последовательный за β и распространяется асимптотически нормально. Если истинное значение параметра β равно β0 и количество правильно оценивает асимптотическую дисперсию этой оценки, то т-статистик асимптотически будет иметь стандартный нормальный распределение.

В некоторых моделях распределение т-статистическое распределение отличается от нормального распределения даже асимптотически. Например, когда Временные ряды с единичный корень регрессирует в расширенный тест Дики – Фуллера, тест т-statistic будет асимптотически иметь одно из распределений Дики – Фуллера (в зависимости от настройки теста).

Использовать

Чаще всего, т статистика используется в Студенты т-тесты, форма статистическая проверка гипотез, а при вычислении некоторых доверительные интервалы.

Ключевое свойство т статистика такова, что это основное количество - хотя его распределение определяется в терминах выборочного среднего, его выборочное распределение не зависит от параметров генеральной совокупности, и поэтому его можно использовать независимо от того, какими они могут быть.

Также можно разделить остаточный по образцу стандартное отклонение:

для вычисления оценки количества стандартных отклонений данный образец от среднего значения, как образец версии z-оценка, z-оценка, требующая параметров популяции.

Прогноз

Учитывая нормальное распределение с неизвестным средним значением и дисперсией т-статистика будущего наблюдения после того, как один сделал п наблюдения, это вспомогательная статистика - основная величина (не зависит от значений μ и σ2), которая является статистикой (вычисляется на основе наблюдений). Это позволяет вычислить частотный интервал прогноза (прогнозирующий доверительный интервал ) через следующее t-распределение:

Решение для дает прогнозное распределение

из которого можно вычислить прогнозные доверительные интервалы - учитывая вероятность п, можно вычислить такие интервалы, что 100п% случаев, следующее наблюдение попадет в этот интервал.

История

Период, термин "т-статистический сокращенно от «статистика проверки гипотез».[нужна цитата ] В статистике t-распределение было впервые получено как апостериорное распределение в 1876 г. Helmert[1][2][3] и Люрот.[4][5][6] T-распределение также появилось в более общей форме как тип Пирсона. IV распространение в Карл Пирсон Бумага 1895 года.[7] Однако T-распределение, также известное как Распределение Т студентов получил свое название от Уильям Сили Госсет который впервые опубликовал его в английской литературе в своей статье 1908 года под названием Биометрика под псевдонимом "Студент"[8][9] потому что его работодатель предпочитал сотрудникам использовать псевдонимы при публикации научных статей вместо их настоящего имени, поэтому он использовал имя «Студент», чтобы скрыть свою личность.[10] Госсет работал в Пивоварня Guinness в Дублин, Ирландия, и интересовался проблемами малых образцов - например, химическими свойствами ячменя, где размер выборки может составлять всего 3. Следовательно, вторая версия этимологии термина Студент заключается в том, что Guinness не хотел, чтобы их конкуренты знали что они использовали t-тест для определения качества сырья. Хотя это был Уильям Госсет, в честь которого был написан термин «Студент», на самом деле он возник благодаря работе Рональд Фишер что это распределение стало известно как "Студенческое распределение"[11][12] и "T-тест Стьюдента "

Связанные понятия

Смотрите также

Рекомендации

  1. ^ Сабо, Иштван (2003), Einführung in die Technische Mechanik, Springer Berlin Heidelberg, стр. 196–199, Дои:10.1007/978-3-642-61925-0_16, ISBN  978-3-540-13293-6 Отсутствует или пусто | название = (помощь); | chapter = игнорируется (помощь)
  2. ^ Шливич, Б. (октябрь 1937 г.). "Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit в Zusammenhang stehende Fragen". Zeitschrift für Anatomie und Entwicklungsgeschichte. 107 (6): 709–737. Дои:10.1007 / bf02118337. ISSN  0340-2061. S2CID  27311567.
  3. ^ Гельмерт (1876 г.). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit". Astronomische Nachrichten (на немецком). 88 (8–9): 113–131. Bibcode:1876AN ..... 88..113H. Дои:10.1002 / asna.18760880802.
  4. ^ Люрот, Дж. (1876 г.). "Vergleichung von zwei Werthen des wahrscheinlichen Fehlers". Astronomische Nachrichten (на немецком). 87 (14): 209–220. Bibcode:1876AN ..... 87..209L. Дои:10.1002 / asna.18760871402.
  5. ^ Пфанзагл Дж, Шейнин О (1996). «Исследования по истории вероятности и статистики. XLIV. Предшественник t-распределения». Биометрика. 83 (4): 891–898. Дои: 10.1093 / biomet / 83.4.891. МИСТЕР 1766040.
  6. ^ Шейнин, Оскар (1995). «Работа Гельмерта по теории ошибок». Архив истории точных наук. 49 (1): 73–104. Дои:10.1007 / BF00374700. ISSN  0003-9519. S2CID  121241599.
  7. ^ Пирсон, К. (1895-01-01). «Вклад в математическую теорию эволюции. II. Косые вариации в однородном материале». Философские труды Королевского общества A: математические, физические и инженерные науки. 186: 343–414 (374). Дои: 10.1098 / rsta.1895.0010. ISSN 1364-503X
  8. ^ "Ученик" [Уильям Сили Госсет ] (1908 г.). «Вероятная ошибка среднего» (PDF). Биометрика. 6 (1): 1–25. Дои: 10.1093 / biomet / 6.1.1. HDL: 10338.dmlcz / 143545. JSTOR 2331554
  9. ^ «Таблица T | История таблицы T, этимология, таблица T с одним концом, таблица T с двумя хвостами и T-статистика».
  10. ^ Wendl MC (2016). «Псевдонимная слава». Наука. 351 (6280): 1406. DOI: 10.1126 / science.351.6280.1406. PMID 27013722
  11. ^ «Оригинальный PDF». Дои:10.15438 / рр.5.1.7. Цитировать журнал требует | журнал = (помощь)
  12. ^ Уолпол, Рональд Э. (2006). Вероятность и статистика для инженеров и ученых. Майерс, Х. Раймонд. (7-е изд.). Нью-Дели: Пирсон. ISBN  81-7758-404-9. OCLC  818811849.

внешняя ссылка