Парадокс точности - Accuracy paradox

В парадокс точности это парадоксальный находя это точность не лучший показатель для прогнозные модели когда классификация в прогнозная аналитика. Это потому, что простая модель может иметь высокий уровень точности, но быть слишком грубой, чтобы быть полезной. Например, если заболеваемость категории А является доминирующей и обнаруживается в 99% случаев, то прогнозирование этого каждый случай категории A будет иметь точность 99%. Точность и отзыв в таких случаях - лучшие меры.[1][2]Основная проблема заключается в том, что существует классовый дисбаланс между положительным и отрицательным классами.[3] При анализе ошибок необходимо учитывать априорные вероятности для этих классов. Точность и отзыв помогают, но точность также может быть искажена очень несбалансированными априорными классами в наборах тестов.

Рекомендации

  1. ^ Абма, Б. Дж. М. (10 сентября 2009 г.), Оценка инструментов управления требованиями с поддержкой анализа воздействия изменений на основе прослеживаемости (PDF), Университет Твенте, стр. 86–87.
  2. ^ Вальверде-Альбасете; Карилло-де-Альборнос; Пелаэс-Морено (2013), "Предложение по новым оценочным метрикам и методике визуализации результатов для задач анализа настроений", Оценка доступа к информации. Многоязычность, мультимодальность и визуализация, Спрингер, ISBN  9783642408021
  3. ^ Афонджа, Техумаде (8 декабря 2017 г.). «Парадокс точности». К науке о данных. Получено 2019-03-15.