Среднеквадратичная ошибка прогноза - Mean squared prediction error

В статистика то среднеквадратичная ошибка прогноза или же среднеквадратичная ошибка прогнозов из сглаживание или же подгонка кривой процедура - это ожидаемое значение квадрата разности между подобранными значениями, подразумеваемыми функцией прогнозирования. и значения (ненаблюдаемой) функции грамм. Это обратная мера объяснительной силы и может использоваться в процессе перекрестная проверка оценочной модели.

Если процедура сглаживания или подгонки матрица проекции (т.е. матрица шляпы) L, отображающий вектор наблюдаемых значений к вектору прогнозируемых значений через тогда

MSPE можно разложить на два члена: среднее квадратов систематических ошибок подобранных значений и среднее значение дисперсии подобранных значений:

Знание грамм требуется для точного расчета MSPE; в противном случае его можно оценить.

Вычисление MSPE по данным вне выборки

Среднеквадратичная ошибка прогноза может быть вычислена точно в двух контекстах. Во-первых, с образец данных длины п, то аналитик данных может запустить регресс только q точек данных (с q < п), сдерживая другой п - д точки данных с конкретной целью использования их для вычисления оценочной модели MSPE вне выборки (т. е. без использования данных, которые использовались в процессе оценки модели). Поскольку процесс регрессии адаптирован к q в точках выборки, обычно MSPE в выборке будет меньше, чем вне выборки, вычисленной за п - д сдерживаемые точки. Если увеличение MSPE вне выборки по сравнению с в выборке относительно невелико, это приводит к положительному обзору модели. И если сравнивать две модели, то та, у которой MSPE ниже, чем у п - д точки данных вне выборки рассматриваются более благоприятно, независимо от относительных характеристик моделей в выборке. MSPE вне выборки в этом контексте является точным для точек данных вне выборки, по которым он был вычислен, но является просто оценкой MSPE модели для большей части ненаблюдаемой совокупности, из которой были взяты данные.

Во-вторых, со временем аналитику данных может стать доступно больше данных, и тогда MSPE может быть вычислен на основе этих новых данных.

Оценка MSPE по населению

Когда модель была оценена по всем доступным данным без каких-либо задержек, MSPE модели по всей численность населения Большинство ненаблюдаемых данных можно оценить следующим образом.

Для модели куда можно написать

При использовании значений данных в выборке первый член справа эквивалентен

Таким образом,

Если известен или хорошо оценен , становится возможным оценить MSPE как

Колин Мэллоуз выступал за этот метод при построении своей статистики выбора модели Cп, который является нормализованной версией расчетной MSPE:

куда п количество оцениваемых параметров п и вычисляется из версии модели, включающей все возможные регрессоры. Это завершает это доказательство.

Смотрите также

дальнейшее чтение

  • Пиндик, Роберт С.; Рубинфельд, Даниэль Л. (1991). «Прогнозирование с использованием моделей временных рядов». Эконометрические модели и экономические прогнозы (3-е изд.). Нью-Йорк: Макгроу-Хилл. стр.516–535. ISBN  0-07-050098-3.