Критерий согласия КолмогороваКритерий согласия Колмогорова предназначен для проверки гипотезы о принадлежности выборки некоторому закону распределения, то есть проверки того, что эмпирическое распределение соответствует предполагаемой модели. Критерий однородности Смирнова используется для проверки гипотезы о принадлежности двух независимых выборок одному закону распределения, то есть о том, что два эмпирических распределения соответствуют одному и тому же закону. Эти критерии носят имена математиков Андрея Николаевича Колмогорова и Николая Васильевича Смирнова. Критерий Смирнова о проверке гипотезы об однородности двух эмпирических законов распределения является одним из наиболее часто используемых непараметрических критериев. ОписаниеЕсли в критерии сопоставляются частоты двух распределений отдельно по каждому разряду, то здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, каждый раз сопоставляются накопленные к данному разряду частоты. Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и различия можно будет признать статистически достоверными. В формулу критерия включается эта разность. Чем больше эмпирическое значение , тем более существенными являются различия. Статистика критерия КолмогороваПусть эмпирическая функция распределения (ЭФР) , построенная по выборке , имеет вид: где указывает, попало ли наблюдение в область : Выполняется проверка того, является ли выборка порождённой случайной величиной с функцией распределения . Статистика критерия для эмпирической функции распределения определяется следующим образом: где под понимается супремум функции . Распределение статистики КолмогороваОбозначим нулевую гипотезу , как гипотезу о том, что выборка подчиняется распределению . Тогда по теореме Колмогорова для введённой статистики справедливо: где -- Тета-функция Якоби. Учтём, что критерий имеет правостороннюю критическую область.
Если достаточно близко к 1, то можно приблизительно рассчитать по формуле: Асимптотическая мощность критерия равна 1. Обозначим теперь за нулевую гипотезу гипотезу о том, что две исследуемые выборки подчиняются одному распределению случайной величины .
Теорема Смирнова позволяет построить критерий для проверки двух выборок на однородность.
См. также
Примечание 1В критерии Колмогорова предпочтительней использование статистики с поправкой Большева в следующем виде . Распределение данной статистики уже не так сильно зависит от объема выборки. Зависимостью её распределения от объема выборки можно пренебречь при . Примечание 2Классический критерий Колмогорова предназначен для проверки простых гипотез. Если проверяется гипотеза о согласии наблюдаемой выборки с законом, все параметры которого известны, то критерий Колмогорова является свободным от распределения: неважно, с каким законом проверяется согласие. Если проверяемая гипотеза справедлива, предельным распределением статистики Колмогорова является распределение Колмогорова . Всё меняется при проверке сложных гипотез, когда по анализируемой выборке оцениваются параметры теоретического закона, согласие с которым проверяется. При проверке сложных гипотез свобода от распределения теряется. При проверке сложных гипотез и справедливости проверяемой гипотезы распределения статистик непараметрических критериев согласия (и критерия Колмогорова) зависят от ряда факторов: от вида наблюдаемого закона, соответствующего проверяемой гипотезе; от типа оцениваемого параметра и числа оцениваемых параметров; в некоторых случаях от конкретного значения параметра (например, в случае семейств гамма- и бета-распределений); от метода оценивания параметров. Различия в предельных распределениях той же самой статистики при проверке простых и сложных гипотез настолько существенны, что пренебрегать этим ни в коем случае нельзя. О применении критерия Колмогорова при проверке сложных гипотез
Ссылки |