Самостоятельная работа №4 на тему НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ». Выполнила Попова Татьяна, группа 324.
Непараметрические критерии –
это критерии, не включающие в формулу расчёта параметров распределения и основанные на оперировании частотами или рангами.
U
- критерий Манна-Уитни
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1
,n2
≥ 3 или n1
=2, n2
≥5.
Существует несколько способов использования критерия и несколько таблиц критических значений, соответствующих этим способам.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. (1-м рядом (выборкой, группой) называют тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом – тот, где они предположительно ниже.
Чем ниже область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении
двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп
, тем более веротно, что различия достоверны.
Ограничения критерия
U
.
1.
В каждой выборке должно быть не менее 3 наблюдений: n1
, n2
≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
2.
В каждой выборке должно быть не более 60 наблюдений; n1
, n2
≤60. Однако уже при n1
, n2
>20 ранжирование становится достаточно трудоёмким.
Критерий Uтребует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.
H
- критерий Крускала-Уоллиса
Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Данный критерий является продолжением критерия U на большее, чем на 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и подсчитываются суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределяется между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой – высокие, а в третьей – средние, то критерий Hпозволит установить эти различия.
Т-критерий Вилкоксона
Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной
и той же выборке испытуемых.
Он позволяет установить не только направленность
изменений, но и их выраженность.
С его помощью определяется, является ли сдвиг показателей в каком-то одном направлении более интенсивным, чем в другом.
Этот критерий применяется в тех случаях, когда признаки измерены по крайней мере по шкале порядка, и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применить критерий Т и в тех случаях, когда сдвиги принимают только три значения: -1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, например от -30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.
Суть метода состоит в том, что сопоставляются выраженность сдвигов в том и ином направлениях по абсолютной величине. Для этого сначала ранжируются все абсолютные величины сдвигов, а потом суммируют ранги. Если сдвиги в положительную и в отрицательную сторону происходят случайно, то суммы рангов абсолютных значений их будут примерно равны. Если же интенсивность сдвига в одном из направлений перевешивает, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Первоначально исходят из предложения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом – сдвиг в более редко встречающемся направлении.
Критерий
X
2
r
Фридмана
Критерий X2
r
применяется для сопоставления показателей, измеренных в трёх
или более
условиях на одной
и той же выборке испытуемых.
Критерий позволяет установить, что величины показателей от условия к условию изменяются,
но при этом не указывает на направление изменений.
Данный критерий является распространением критерия Т Вилкоксона на большее, чем на 2, количество условий измерения. Однако здесь мы ранжируем не абсолютные величины сдвигов, а сами индивидуальные значения, полученные данным испытуемым в 1, 2, 3 и т. д. замерах.
После того, как все значения будут проранжированы, подсчитываются суммы рангов по столбцам для каждого из произведённых замеров.
Если различия между значениями признака, полученными в разных условиях, случайны, то суммы рангов по разным условиям будут приблизительно равны. Но если значения признака изменяются в разных условиях каким-то закономерным образом, то в одних условиях будут преобладать высокие ранги, а в других – низкие. Суммы рангов будут достоверно различаться между собой. Эмпирическое значение критерия X2
r
иуказывает на то, насколько различаются суммы рангов. Чем больше эмпирическое значение X2
r
, тем более существенные расхождения сумм рангов оно отражает.
Если X2
r
равняется критическому значению или превышает его, различия статистически достоверны.
λ - Критерий Колмогорова-Смирнова
Критерий предназначен для сопоставления двух распределений:
a) Эмпирического с теоретическим, например, равномерным или нормальным;
b) Одного эмпирического распределения с другим эмпирическим распределением.
Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.
Если в методе Х2
сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь сопоставляются сначала частоты по первому разряду, потом по сумме первого и второго разрядов и т.д. Таким образом, сопоставляются всякий раз накопленные к данному разряду частоты.
Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверными. В формулу критерия λ
включается эта разность. Чем больше эмпирическое значение λ
, тем более существенны различия.
Критерий серий Вальда-Вольфовица
устроен следующим образом. Представьте, что вы хотите сравнить мужчин и женщин по некоторому признаку. Вы можете упорядочить данные, например, по возрастанию, и найти те случаи, когда субъекты одного и того же пола примыкают друг к другу в построенном вариационном ряде (иными словами, образуют серию). Если нет различия между мужчинами и женщинами, то число и длина «серий», относящиеся к одному и тому же полу, будут более или менее случайными. В противном случае две группы (мужчины и женщины) отличаются друг от друга, то есть не являются однородными. Критерий предполагает, что рассматриваемые переменные являются непрерывными и измерены, по крайней мере, в порядковой шкале. Критерий серий Вальда—Вольфовица проверяет гипотезу о том, что две независимые выборки извлечены из двух популяций, которые в чем-то существенно различаются между собой, иными словами, различаются не только средними, но также формой распределения. Нулевая гипотеза состоит в том, что обе выборки извлечены из одной и той же популяции, то есть данные однородны.
Q -критерий Кохрена
Q-критерий Кохрена — это развитие критерия Макнемара. Критерий проверяет, значимо или нет различаются между собой несколько сравниваемых переменных, принимающих значения 0-1.
Медианный тест
— это «грубая» версия критерия Крускала—Уоллиса. STATISTICA просто подсчитывает число наблюдений каждой выборки, которые попадают выше или ниже общей медианы выборок. При нулевой гипотезе (все выборки извлечены из популяций с равными медианами) ожидается, что примерно 50% всех наблюдений в каждой выборке попадают выше (или ниже) общей медианы. Медианный тест особенно полезен, когда шкала содержит искусственные границы, и многие наблюдения попадают в ту или иную крайнюю точку (оказываются «вне шкалы»).
|