Федеральное агентство по образованию РФ
Сибирская государственная автомобильно-дорожная академия (СибАДИ)
Кафедра: «Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Тема: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона»
Выполнила: студентка 23ЭУТ
Хасянова А.Ф.
Проверил: Матвеева С.В
Дата_______________
Оценка_____________
Омск-2010
Содержание
1. Введение. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х
5. Оценки числовых характеристик и параметров выдвинутого закона
6. Теоретическая функция плотности рассматриваемого закона распределения «Построение ее на гистограмме»
7. Проверка критерия Пирсона
Вывод
1. Исходные данные варианта №20
Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.
Таблица 1
79,02
|
79,70
|
74,68
|
20,47
|
11,70
|
44,64
|
40,75
|
8,59
|
96,42
|
6,17
|
91,75
|
93,29
|
77,57
|
81,25
|
76,59
|
51,84
|
6,17
|
42,79
|
80,87
|
92,81
|
48,04
|
14,70
|
100,64
|
69,83
|
94,56
|
70,42
|
47,93
|
47,48
|
66,79
|
42,12
|
20,27
|
51,36
|
62,51
|
66,86
|
87,99
|
99,29
|
5,96
|
60,38
|
62,53
|
75,50
|
46,55
|
83,53
|
55,65
|
59,26
|
77,05
|
101,10
|
29,93
|
102,21
|
86,11
|
45,92
|
90,93
|
24,30
|
9,76
|
90,25
|
36,72
|
84,96
|
20,50
|
81,99
|
56,29
|
31,75
|
43,61
|
68,70
|
80,47
|
100,66
|
29,98
|
48,88
|
40,37
|
67,46
|
91,46
|
59,11
|
90,75
|
4,64
|
36,53
|
32,39
|
6,99
|
8,41
|
30,85
|
37,30
|
64,44
|
25,60
|
18,00
|
84,27
|
98,88
|
36,39
|
34,64
|
49,49
|
10,53
|
50,97
|
39,40
|
3,59
|
100,39
|
18,57
|
9,27
|
10,89
|
65,91
|
35,62
|
75,45
|
37,86
|
89,74
|
4,57
|
Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.
2. Построение вариационного ряда
Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.
Проранжировав статистические данные, получаем вариационный ряд (табл. 2).
Таблица 2
3,59
|
9,76
|
24,30
|
36,53
|
44,64
|
51,84
|
66,68
|
77,05
|
84,96
|
93,29
|
4,57
|
10,53
|
25,60
|
36,72
|
45,92
|
55,65
|
66,79
|
77,75
|
86,11
|
94,56
|
4,64
|
10,89
|
29,93
|
37,30
|
46,55
|
56,29
|
67,46
|
79,02
|
87,99
|
96,42
|
5,96
|
11,70
|
29,98
|
37,86
|
47,48
|
59,11
|
68,78
|
79,70
|
89,74
|
98,88
|
6,17
|
14,70
|
30,85
|
39,40
|
47,93
|
59,26
|
69,83
|
80,47
|
90,25
|
99,29
|
6,17
|
18,00
|
31,75
|
40,37
|
48,04
|
60,38
|
70,42
|
80,87
|
90,75
|
100,39
|
6,99
|
18,57
|
32,39
|
40,75
|
48,88
|
62,51
|
74,68
|
81,25
|
90,93
|
100,46
|
8,41
|
20,27
|
34,64
|
42,12
|
49,49
|
62,53
|
75,45
|
81,99
|
91,46
|
100,66
|
8,59
|
20,47
|
35,62
|
42,79
|
50,97
|
64,44
|
75,50
|
83,53
|
91,75
|
101,10
|
9,27
|
20,50
|
36,39
|
43,61
|
51,36
|
65,71
|
76,59
|
84,27
|
92,81
|
102,21
|
3. Построение интервального вариационного ряда
Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.
Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.
Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,
т.е. – число (частота) попаданий значений X в i-й разряд, n – объем выборки.
Т.к. согласно теореме Бернулли имеем, что т.е. выборочная относительная частота сходится по вероятности соответствующей вероятности, тогда из условия:
Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С.В. с соответствующими им частотами или относительными частотами.
Для построения интервального вариационного ряда выполняем следующие действия.
1. Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .
2. Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса: где n – объем выборки, К– число частичных интервалов . ,
3. ∆=10
4. Определяем начало первого частичного интервала
После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3).
Таблица 3
|
Разряды
|
mi
|
|
|
=
|
1
|
[3.5-13.5)
|
14
|
0.14
|
0.014
|
8.5
|
2
|
[13.5-23.5)
|
6
|
0.06
|
0.006
|
18.5
|
3
|
[23.5-33.5)
|
7
|
0.07
|
0.007
|
28.5
|
4
|
[33.5-43.5)
|
12
|
0.12
|
0.012
|
38.5
|
5
|
[43.5-53.5)
|
12
|
0.12
|
0.012
|
48.5
|
6
|
[53.5-63.5)
|
7
|
0.07
|
0.007
|
58.5
|
7
|
[63.5-73.5)
|
8
|
0.08
|
0.008
|
68.5
|
8
|
[73.5-83.5)
|
12
|
0.12
|
0.012
|
78.5
|
9
|
[83.5-93.5)
|
13
|
0.13
|
0.013
|
88.5
|
10
|
[93.5-103.5)
|
9
|
0.09
|
0.009
|
98.5
|
Контроль
|
|
=100
|
=1
|
|
|
Где -плотность относительной частоты
-середина частичных интервалов
4. Построение гистограммы
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению – плотность частоты (или – плотность частности).
По данным таблицы 4 строим гистограмму (рис. 1).
Гистограмма частот является статистическим аналогом дифференциальной функции распределения (плотности) случайной величины Х. Площадь гистограммы равна единице.
Выдвижение гипотезы о законе распределения генеральной совокупности
По данным наблюдений статистическое среднее и выборочное среднее квадратическое отклонение у* по значению почти совпадают. Учитывая данный факт, а также вид гистограммы можно предположить, что случайная величина имеет равномерное распределение.
По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.
5. Оценка числовых характеристик и параметров закона распределения
Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.
Оценка называется точечной, если она определяется числом или точкой на числовой оси.
Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.
При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:
где n - объем выборки, – i-й элемент выборки
Составим таблицу для нахождения и
Таблица 4
i
|
|
|
1
|
|
8.5*14=119
|
2
|
|
18.5*6=111
|
3
|
|
28.5*7=199.5
|
4
|
|
38.5*12=462
|
5
|
|
48.5*12=582
|
6
|
|
58.5*7=409.5
|
7
|
|
68.5*8=548
|
8
|
|
78.5*12=942
|
9
|
|
88.5*13=1150.5
|
10
|
|
98.5*9=886.5
|
|
|
|
6. Равномерный закон
интервальный вариационный генеральный совокупность
Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону
найдем функцию плотности равномерного закона вычислив оценки параметров и
,
Т.к М(x)= , , D(x)=
Таблица 5
i
|
|
1
|
|
2
|
|
3
|
|
4
|
|
5
|
|
6
|
|
7
|
|
8
|
|
9
|
|
10
|
|
|
186
|
После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности
7 Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона
В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.
Пирсон доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов интервального вариационного ряда. При увеличении ч2, и находится по формуле:
К = или К =
Дальнейшие вычисления, необходимые для определения расчетного значения выборочной статистики , проведем в таблице 5.
Таблица 6
i
|
|
|
|
|
|
/
|
1
|
0.14
|
14
|
0.1029
|
10.29
|
|
13.76/10.37=1.33
|
2
|
0.06
|
6
|
0.1
|
10
|
|
16/10=1.6
|
3
|
0.07
|
7
|
0.1
|
10
|
|
16/10=1.6
|
4
|
0.12
|
12
|
0.1
|
10
|
|
16/10=1.6
|
5
|
0.12
|
12
|
0.1
|
10
|
|
16/10=1.6
|
6
|
0.07
|
7
|
0.1
|
10
|
|
16/10=1.6
|
7
|
0.08
|
8
|
0.1
|
10
|
|
16/10=1.6
|
8
|
0.12
|
12
|
0.1
|
10
|
|
16/10=1.6
|
9
|
0.13
|
13
|
0.1
|
10
|
|
16/10=1.6
|
10
|
0.09
|
9
|
0.1149
|
11.49
|
|
6.3/11.49=0.548
|
|
|
|
|
|
01.86
|
|
Чтобы найти значение надо воспользоваться табличными распределениями в которых значение сл. величины находят по заданному уровню значимости и вычисленному числу степеней свободы
R- число частичных интервалов в таблице 1 но если в некоторых из интервалов значения то надо объединить расположенные рядом интервалы так, чтобы тогда число
R-это число из необъединенных интервалов
i- число неизвестных параметров
В рассматриваемом эмпирическом распределении не имеются частоты, меньшие 5. Случайная величина ч2 (мера расхождения) независимо от вида закона распределения генеральной совокупности при (n ≥ 50) имеет распределение ч2 с числом степеней свободы
1) К =
уровень значимости б =1–=0,05
,
найдем по таблице значений критическое значение для б = 0,05 и =9
Имеем =16.9. Так как то предполагаемая гипотеза о показательном законе распределения генеральной совокупности не противоречит опытным данным и принимается на уровне значимости б.
2)=,
=
3) M(x)= ,
M(x)=
4) D(x)=
D(x.1)=
5) Таким образом, критическая область для гипотезы задается неравенством ; P()= Это означает, что нулевую гипотезу можно считать правдоподобной и гипотеза Но принимается
Вывод: В ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по критерию Пирсона. Определили параметры и числовые характеристики закона и построили для них доверительные интервалы.
|