ЗАДАНИЕ
Задача 1.
Используя метод парного корреляционно-регрессионного анализа выявить зависимость между объемом продаж (Y) и расходами на рекламу (X). Постройте поле корреляции. Для аппроксимации используйте как минимум 3 вида зависимостей (прямолинейную, параболическую и логарифмическую). Оценить тесноту связи и точность аппроксимации, сделайте выводы о возможности использования модели для прогнозирования.
Расходы на рекламу X |
Объем продаж Y |
1 |
9 |
80 |
2 |
12 |
130 |
3 |
12 |
100 |
4 |
12 |
150 |
5 |
12 |
150 |
6 |
13 |
270 |
7 |
14 |
170 |
8 |
11 |
130 |
9 |
9 |
90 |
10 |
10 |
120 |
11 |
11 |
100 |
12 |
12 |
120 |
13 |
15 |
220 |
14 |
12 |
130 |
15 |
11 |
130 |
16 |
14 |
130 |
17 |
12 |
120 |
18 |
15 |
220 |
19 |
16 |
170 |
Задача 2
Определить зависимость между фактором и результатирующим признаком по данным, приведенным в таблице. Рассчитать коэффициент корреляции, определить вид зависимости, параметры линии регрессии, корреляционное отношение и оценить точность аппроксимации.
N |
Основная заработная плата (тыс. ден. ед) |
Расходы по эксплуатации машин и механизмов (тыс. ден. ед) |
1 |
6.3 |
3.2 |
2 |
1.1 |
0.5 |
3 |
2.9 |
1.2 |
4 |
2.5 |
1.0 |
5 |
2.3 |
0.5 |
6 |
4.7 |
1.6 |
7 |
2.5 |
0.8 |
8 |
3.6 |
1.3 |
9 |
5.0 |
2.1 |
10 |
0.7 |
0.3 |
11 |
7.0 |
3.2 |
12 |
1.0 |
0.5 |
13 |
3.1 |
1.4 |
14 |
2.8 |
1.8 |
15 |
1.4 |
0.3 |
16 |
1.0 |
0.4 |
17 |
5.1 |
2.3 |
18 |
2.6 |
1.0 |
18 |
3.8 |
1.3 |
20 |
2.5 |
1.3 |
РЕШЕНИЕ
Задача 1
Поле корреляции:
1. Прямолинейная зависимость
Уравнение прямой y =
a+
bx
, таким образом, используя метод наименьших квадратов, минимизируем функцию . Для нахождения коэффициентов a и b, продифференцируем по каждому параметру a и b приравняем, 0 и получим систему уравнений.
Для вычисления параметров a и b прямой заполняем расчетную таблицу:
X |
Y |
XY |
X^2 |
Y^2 |
1 |
9 |
80 |
720 |
81 |
6400 |
2 |
12 |
130 |
1560 |
144 |
16900 |
3 |
12 |
100 |
1200 |
144 |
10000 |
4 |
12 |
150 |
1800 |
144 |
22500 |
5 |
12 |
150 |
1800 |
144 |
22500 |
6 |
13 |
270 |
3510 |
169 |
72900 |
7 |
14 |
170 |
2380 |
196 |
28900 |
8 |
11 |
130 |
1430 |
121 |
16900 |
9 |
9 |
90 |
810 |
81 |
8100 |
10 |
10 |
120 |
1200 |
100 |
14400 |
11 |
11 |
100 |
1100 |
121 |
10000 |
12 |
12 |
120 |
1440 |
144 |
14400 |
13 |
15 |
220 |
3300 |
225 |
48400 |
14 |
12 |
130 |
1560 |
144 |
16900 |
15 |
11 |
130 |
1430 |
121 |
16900 |
16 |
14 |
130 |
1820 |
196 |
16900 |
17 |
12 |
120 |
1440 |
144 |
14400 |
18 |
15 |
220 |
3300 |
225 |
48400 |
19 |
16 |
170 |
2720 |
256 |
28900 |
232 |
2730 |
34520 |
2900 |
434700 |
X |
Y |
|
|
|
|
1 |
X |
Y |
87.02 |
0.09 |
49.31 |
4055.68 |
2 |
9 |
80 |
139.97 |
0.08 |
99.37 |
187.26 |
3 |
12 |
130 |
139.97 |
0.40 |
1597.49 |
1908.31 |
4 |
12 |
100 |
139.97 |
0.07 |
100.63 |
39.89 |
5 |
12 |
150 |
139.97 |
0.07 |
100.63 |
39.89 |
6 |
12 |
150 |
157.62 |
0.42 |
12629.81 |
15955.68 |
7 |
13 |
270 |
175.27 |
0.03 |
27.74 |
692.52 |
8 |
14 |
170 |
122.32 |
0.06 |
58.99 |
187.26 |
9 |
11 |
130 |
87.02 |
0.03 |
8.87 |
2881.99 |
10 |
9 |
90 |
104.67 |
0.13 |
234.98 |
560.94 |
11 |
10 |
120 |
122.32 |
0.22 |
498.17 |
1908.31 |
12 |
11 |
100 |
139.97 |
0.17 |
398.75 |
560.94 |
13 |
12 |
120 |
192.92 |
0.12 |
733.58 |
5824.10 |
14 |
15 |
220 |
139.97 |
0.08 |
99.37 |
187.26 |
15 |
12 |
130 |
122.32 |
0.06 |
58.99 |
187.26 |
16 |
11 |
130 |
175.27 |
0.35 |
2049.05 |
187.26 |
17 |
14 |
130 |
139.97 |
0.17 |
398.75 |
560.94 |
18 |
12 |
120 |
192.92 |
0.12 |
733.58 |
5824.10 |
19 |
15 |
220 |
210.56 |
0.24 |
1645.46 |
692.52 |
16 |
170 |
2.89 |
21523.51 |
42442.11 |
r = 0.88
r > 0, следовательно, связь прямая.
|r|>0.65 – связь тесная
= 14.17 %
Уравнение аппроксимирующей прямой
=0.88
2. Параболическая зависимость
Уравнение параболы y = a + bx + cx2
. Сделаем замену x=x1
, x2
=x2
, перейдем к уравнению: y = a + bx1
+ cx2.
Продифференцируем по каждому параметру a, b и с, приравняем к 0, получим систему уравнений:
Для вычисления параметров a, b и с заполняем расчетную таблицу:
X |
Y |
XY |
X^2 |
Y^2 |
X^3 |
X^4 |
X^2 * Y |
1 |
12 |
130 |
1560 |
144 |
16900 |
1728 |
20736 |
18720 |
2 |
13 |
170 |
2210 |
169 |
28900 |
2197 |
28561 |
28730 |
3 |
12 |
110 |
1320 |
144 |
12100 |
1728 |
20736 |
15840 |
4 |
11 |
121 |
1331 |
121 |
14641 |
1331 |
14641 |
14641 |
5 |
15 |
130 |
1950 |
225 |
16900 |
3375 |
50625 |
29250 |
6 |
12 |
120 |
1440 |
144 |
14400 |
1728 |
20736 |
17280 |
7 |
11 |
110 |
1210 |
121 |
12100 |
1331 |
14641 |
13310 |
8 |
8 |
70 |
560 |
64 |
4900 |
512 |
4096 |
4480 |
9 |
12 |
140 |
1680 |
144 |
19600 |
1728 |
20736 |
20160 |
10 |
12 |
120 |
1440 |
144 |
14400 |
1728 |
20736 |
17280 |
11 |
13 |
150 |
1950 |
169 |
22500 |
2197 |
28561 |
25350 |
12 |
12 |
120 |
1440 |
144 |
14400 |
1728 |
20736 |
17280 |
13 |
14 |
200 |
2800 |
196 |
40000 |
2744 |
38416 |
39200 |
14 |
13 |
130 |
1690 |
169 |
16900 |
2197 |
28561 |
21970 |
15 |
15 |
240 |
3600 |
225 |
57600 |
3375 |
50625 |
54000 |
16 |
16 |
200 |
3200 |
256 |
40000 |
4096 |
65536 |
51200 |
17 |
17 |
290 |
4930 |
289 |
84100 |
4913 |
83521 |
83810 |
18 |
18 |
290 |
5220 |
324 |
84100 |
5832 |
104976 |
93960 |
19 |
17 |
200 |
3400 |
289 |
40000 |
4913 |
83521 |
57800 |
253 |
3041 |
42931 |
3481 |
554441 |
49381 |
720697 |
624261 |
Получим систему уравнений:
19a+253b+3481c=3041
253a+3481b+49381c=42931
3481a+49381b+720697c=624261
Решим данную систему средствами Matlab:
>> a=[19 253 3481;253 3481 49381;3481 49381 720697]
a =
19 253 3481
253 3481 49381
3481 49381 720697
>> b=[3041;42931;624261]
b =
3041
42931
624261
>> format long
>> a\b
ans =
70.030968707669246
-8.789656532559803
1.130190950098223
Таким образом, a=70.030968707669246
b= -8.789656532559803
c=1.130190950098223
Уравнение аппроксимирующей параболы
X |
Y |
|
|
|
|
1 |
12 |
130 |
127.30 |
0.02 |
7.28 |
903.16 |
2 |
13 |
170 |
146.77 |
0.14 |
539.74 |
98.95 |
3 |
12 |
110 |
127.30 |
0.16 |
299.38 |
2505.27 |
4 |
11 |
121 |
110.10 |
0.09 |
118.86 |
1525.11 |
5 |
15 |
130 |
192.48 |
0.48 |
3903.64 |
903.16 |
6 |
12 |
120 |
127.30 |
0.06 |
53.33 |
1604.21 |
7 |
11 |
110 |
110.10 |
0.00 |
0.01 |
2505.27 |
8 |
8 |
70 |
72.05 |
0.03 |
4.19 |
8109.48 |
9 |
12 |
140 |
127.30 |
0.09 |
161.22 |
402.11 |
10 |
12 |
120 |
127.30 |
0.06 |
53.33 |
1604.21 |
11 |
13 |
150 |
146.77 |
0.02 |
10.45 |
101.06 |
12 |
12 |
120 |
127.30 |
0.06 |
53.33 |
1604.21 |
13 |
14 |
200 |
168.49 |
0.16 |
992.68 |
1595.79 |
14 |
13 |
130 |
146.77 |
0.13 |
281.16 |
903.16 |
15 |
15 |
240 |
192.48 |
0.20 |
2258.24 |
6391.58 |
16 |
16 |
200 |
218.73 |
0.09 |
350.64 |
1595.79 |
17 |
17 |
290 |
247.23 |
0.15 |
1829.10 |
16886.32 |
18 |
18 |
290 |
278.00 |
0.04 |
144.02 |
16886.32 |
19 |
17 |
200 |
247.23 |
0.24 |
2230.86 |
1595.79 |
253 |
3041 |
2.21 |
13291.44 |
67720.95 |
r = 0.88
r > 0, следовательно, связь прямая.
|r|>0.65 – связь тесная
= 11.65%
= 0.90
Поскольку >r, то кривая лучше аппроксимирует зависимость
3. Логарифмическая зависимость
y = a + b lnx
После замены lnx=z получим линейную зависимость, формулы для вычисления коэффициентов которой известны. После обратной замены получим:
lnX |
Y |
lnXY |
(lnX)^2 |
Y^2 |
1 |
12 |
2.48 |
130 |
323.04 |
6.17 |
16900 |
2 |
13 |
2.56 |
170 |
436.04 |
6.58 |
28900 |
3 |
12 |
2.48 |
110 |
273.34 |
6.17 |
12100 |
4 |
11 |
2.40 |
121 |
290.15 |
5.75 |
14641 |
5 |
15 |
2.71 |
130 |
352.05 |
7.33 |
16900 |
6 |
12 |
2.48 |
120 |
298.19 |
6.17 |
14400 |
7 |
11 |
2.40 |
110 |
263.77 |
5.75 |
12100 |
8 |
8 |
2.08 |
70 |
145.56 |
4.32 |
4900 |
9 |
12 |
2.48 |
140 |
347.89 |
6.17 |
19600 |
10 |
12 |
2.48 |
120 |
298.19 |
6.17 |
14400 |
11 |
13 |
2.56 |
150 |
384.74 |
6.58 |
22500 |
12 |
12 |
2.48 |
120 |
298.19 |
6.17 |
14400 |
13 |
14 |
2.64 |
200 |
527.81 |
6.96 |
40000 |
14 |
13 |
2.56 |
130 |
333.44 |
6.58 |
16900 |
15 |
15 |
2.71 |
240 |
649.93 |
7.33 |
57600 |
16 |
16 |
2.77 |
200 |
554.52 |
7.69 |
40000 |
17 |
17 |
2.83 |
290 |
821.63 |
8.03 |
84100 |
18 |
18 |
2.89 |
290 |
838.21 |
8.35 |
84100 |
19 |
17 |
2.83 |
200 |
566.64 |
8.03 |
40000 |
å |
48.86 |
3041 |
8003.32 |
126.34 |
554441 |
a= -542.07
b=273.01
Уравнение аппроксимирующей логарифмической зависимости
X |
lnX |
Y |
|
|
|
|
1 |
12 |
2.48 |
130 |
136.33 |
0.05 |
40.09 |
903.16 |
2 |
13 |
2.56 |
170 |
158.18 |
0.07 |
139.61 |
98.95 |
3 |
12 |
2.48 |
110 |
136.33 |
0.24 |
693.36 |
2505.27 |
4 |
11 |
2.40 |
121 |
112.58 |
0.07 |
70.95 |
1525.11 |
5 |
15 |
2.71 |
130 |
197.25 |
0.52 |
4522.87 |
903.16 |
6 |
12 |
2.48 |
120 |
136.33 |
0.14 |
266.73 |
1604.21 |
7 |
11 |
2.40 |
110 |
112.58 |
0.02 |
6.64 |
2505.27 |
8 |
8 |
2.08 |
70 |
25.64 |
0.63 |
1968.20 |
8109.48 |
9 |
12 |
2.48 |
140 |
136.33 |
0.03 |
13.46 |
402.11 |
10 |
12 |
2.48 |
120 |
136.33 |
0.14 |
266.73 |
1604.21 |
11 |
13 |
2.56 |
150 |
158.18 |
0.05 |
66.98 |
101.06 |
12 |
12 |
2.48 |
120 |
136.33 |
0.14 |
266.73 |
1604.21 |
13 |
14 |
2.64 |
200 |
178.42 |
0.11 |
465.85 |
1595.79 |
14 |
13 |
2.56 |
130 |
158.18 |
0.22 |
794.35 |
903.16 |
15 |
15 |
2.71 |
240 |
197.25 |
0.18 |
1827.37 |
6391.58 |
16 |
16 |
2.77 |
200 |
214.87 |
0.07 |
221.18 |
1595.79 |
17 |
17 |
2.83 |
290 |
231.42 |
0.20 |
3431.25 |
16886.32 |
18 |
18 |
2.89 |
290 |
247.03 |
0.15 |
1846.60 |
16886.32 |
19 |
17 |
2.83 |
200 |
231.42 |
0.16 |
987.41 |
1595.79 |
å |
48.86 |
3041 |
3.18 |
17896.35 |
67720.95 |
r=0.86
r > 0, следовательно, связь прямая.
|r|>0.65 – связь тесная
=16.71%
=0.86
4. Вывод о возможности использования модели для прогнозирования
Для аппроксимации было использовано 3 вида зависимостей: прямолинейная, параболическая, логарифмическая.
прямолинейная |
параболическая |
логарифмическая |
Уравнение |
|
|
|
r |
0.88 |
0.88 |
0.86 |
|
0.88 |
0.90 |
0.86 |
|
14.17 % |
11.65% |
16.71% |
Во всех случаях связь прямая и тесная. Точнее всего аппроксимирует парабола, поскольку >r, минимальна и равна 11.65%.
Прямая аппроксимирует зависимость менее точно, т.к. больше - 14.17 %.
Наименее точно аппроксимирует логарифмическая зависимость, т.к. максимальна и равна 16.71%.
Вывод: наилучшая модель для прогнозирования – параболическая, наихудшая – логарифмическая. Это объясняется тем, что выпуклость данных кривых различна.
Задача 2
Используем линейную зависимость. Коэффициенты прямой находятся по формулам
X |
Y |
XY |
X^2 |
Y^2 |
1 |
6.3 |
3.2 |
20.16 |
39.69 |
10.24 |
2 |
1.1 |
0.5 |
0.55 |
1.21 |
0.25 |
3 |
2.9 |
1.2 |
3.48 |
8.41 |
1.44 |
4 |
2.5 |
1 |
2.5 |
6.25 |
1 |
5 |
2.3 |
0.5 |
1.15 |
5.29 |
0.25 |
6 |
4.7 |
1.6 |
7.52 |
22.09 |
2.56 |
7 |
2.5 |
0.8 |
2 |
6.25 |
0.64 |
8 |
3.6 |
1.3 |
4.68 |
12.96 |
1.69 |
9 |
5 |
2.1 |
10.5 |
25 |
4.41 |
10 |
0.7 |
0.3 |
0.21 |
0.49 |
0.09 |
11 |
7 |
3.2 |
22.4 |
49 |
10.24 |
12 |
1 |
0.5 |
0.5 |
1 |
0.25 |
13 |
3.1 |
1.4 |
4.34 |
9.61 |
1.96 |
14 |
2.8 |
1.8 |
5.04 |
7.84 |
3.24 |
15 |
1.4 |
0.3 |
0.42 |
1.96 |
0.09 |
16 |
1 |
0.4 |
0.4 |
1 |
0.16 |
17 |
5.1 |
2.3 |
11.73 |
26.01 |
5.29 |
18 |
2.6 |
1 |
2.6 |
6.76 |
1 |
19 |
3.8 |
1.3 |
4.94 |
14.44 |
1.69 |
20 |
2.5 |
1.3 |
3.25 |
6.25 |
1.69 |
61.9 |
26 |
108.37 |
251.51 |
48.18 |
Поле корреляции:
N=20
a = -0.14
b= 0.47 => y = -0.14 + 0.47
x
X |
Y |
|
|
|
|
1 |
6.3 |
3.2 |
2.79 |
0.13 |
0.17 |
3.61 |
2 |
1.1 |
0.5 |
0.37 |
0.26 |
0.02 |
0.64 |
3 |
2.9 |
1.2 |
1.21 |
0.01 |
0.00 |
0.01 |
4 |
2.5 |
1 |
1.02 |
0.02 |
0.00 |
0.09 |
5 |
2.3 |
0.5 |
0.93 |
0.86 |
0.18 |
0.64 |
6 |
4.7 |
1.6 |
2.05 |
0.28 |
0.20 |
0.09 |
7 |
2.5 |
0.8 |
1.02 |
0.28 |
0.05 |
0.25 |
8 |
3.6 |
1.3 |
1.54 |
0.18 |
0.06 |
4.93038E-32 |
9 |
5 |
2.1 |
2.19 |
0.04 |
0.01 |
0.64 |
10 |
0.7 |
0.3 |
0.19 |
0.38 |
0.01 |
1 |
11 |
7 |
3.2 |
3.12 |
0.03 |
0.01 |
3.61 |
12 |
1 |
0.5 |
0.32 |
0.35 |
0.03 |
0.64 |
13 |
3.1 |
1.4 |
1.30 |
0.07 |
0.01 |
0.01 |
14 |
2.8 |
1.8 |
1.16 |
0.35 |
0.41 |
0.25 |
15 |
1.4 |
0.3 |
0.51 |
0.70 |
0.04 |
1 |
16 |
1 |
0.4 |
0.32 |
0.19 |
0.01 |
0.81 |
17 |
5.1 |
2.3 |
2.23 |
0.03 |
0.00 |
1 |
18 |
2.6 |
1 |
1.07 |
0.07 |
0.00 |
0.09 |
19 |
3.8 |
1.3 |
1.63 |
0.25 |
0.11 |
4.93038E-32 |
20 |
2.5 |
1.3 |
1.02 |
0.21 |
0.08 |
4.93038E-32 |
61.9 |
26 |
4.69 |
1.39 |
14.38 |
Коэффициент корреляции r находится по формуле:
r = 0.95
r > 0, следовательно, связь прямая.
|r|>0.65 – связь тесная
Корреляционное отношение = 0.95
Точность аппроксимации= 23.47%
|