ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
САМАРСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ
КОНТРОЛЬНАЯ РАБОТА
По курсу: Эконометрика
На тему: Парная регрессия (Вариант №9)
Выполнил студент 1 курса ФВВиДО
Специальность:БУАА
Конкина Анна Андреевна
Руководитель: Репина Е.Г.
г. Самара
2010г.
По данным 12-летних наблюдений исследовали зависимость признаков Х
иY
, где Х
– темп прироста капиталовложений, %; Y
– выпуск валовой продукции, млн. руб. Признаки имеют нормальный закон распределения.
X
|
6,6 |
6,9 |
7,4 |
4,6 |
10 |
20 |
21,7 |
22,2 |
22,4 |
25,1 |
29 |
32,9 |
Y
|
2,7 |
3,2 |
2,9 |
2,5 |
3 |
4,6 |
5,7 |
5,9 |
5,2 |
5,8 |
7,9 |
9,8 |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи между темпом прироста капиталовложений и выпуском валовой продукции.
2. Рассчитайте оценки параметров , уравнения парной линейной регрессии.
3. Оцените тесноту связи между темпом прироста капиталовложений и выпуском с помощью выборочного коэффициента корреляции (r
в
). Проверьте значимость коэффициента корреляции(α =0,1).
4. Рассчитайте выборочный коэффициент детерминации (R
2
в
). Сделайте экономический вывод.
5. Проверьте значимость оценки параметра с помощью критерия Стьюдента при уровне значимости α =0,1.
6. Постройте 90-процентный доверительный интервал для коэффициента регрессии b
. Сделайте экономический вывод.
7. Проверьте значимость оценки параметра с помощью критерия Стьюдента при уровне значимости α =0,1.
8. Постройте 90-процентный доверительный интервал для свободного члена уравнения а
.
9. Составьте таблицу дисперсионного анализа.
10. Оцените с помощью F
-критерия Фишера - Снедекора значимость уравнения линейной регрессии (α =0,1).
11. Рассчитайте выпуск валовой продукции (), если темп прироста капиталовложений составит 15%. Постройте 90-процентный доверительный интервал для прогнозного значения объясняемой переменной (). Сделайте экономический вывод.
12. Рассчитайте средний коэффициент эластичности (). Сделайте экономический вывод.
13. Проверьте гипотезу Н
0
: b
= b
0
, (b
0
= 0,25).
14. На поле корреляции постройте линию регрессии.
1
. Построим поле корреляции (рис. 1) и сформулируем гипотезу о форме связи между признаками:
Х
–
темп прироста капиталовложений,%;
Y
-
выпуск валовой продукции, млн.руб.
По расположению точек на поле корреляции можно предположить наличие прямой линейной связи между темпом прироста капиталовложений и выпуском валовой продукции.
2
. Рассчитаем оценки параметров линейной модели
методом наименьших квадратов (МНК). Оценкой модели по выборке является выборочное уравнение регрессии
. (1)
Таблица
1
|
№ п\п |
х
i
|
у
i
|
х
i
2
|
у
i
х
i
|
у
i
2
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
1 |
6,6 |
2,7 |
43,56 |
17,82 |
7,29 |
2,54308 |
0,00246 |
5,713295 |
4,98776 |
116,64 |
2 |
6,9 |
3,2 |
47,61 |
22,08 |
10,24 |
2,60948 |
0,34871 |
5,40028 |
3,00443 |
110,25 |
3 |
7,4 |
2,9 |
54,76 |
21,46 |
8,41 |
2,72014 |
0,03235 |
4,89821 |
4,13443 |
100 |
4 |
4,6 |
2,5 |
21,16 |
11,5 |
6,25 |
2,10044 |
0,15965 |
8,02527 |
5,92109 |
153,84 |
5 |
10 |
3 |
100 |
30 |
9 |
3,29557 |
0,08736 |
2,68226 |
3,73776 |
54,76 |
6 |
20 |
4,6 |
400 |
92 |
21,16 |
5,50877 |
0,82586 |
0,33113 |
0,11111 |
6,76 |
7 |
21,7 |
5,7 |
470,89 |
123,69 |
32,49 |
5,88501 |
0,03423 |
0,90569 |
0,58778 |
18,49 |
8 |
22,2 |
5,9 |
492,84 |
130,98 |
34,81 |
5,99567 |
0,00915 |
1,12857 |
0,93445 |
23,04 |
9 |
22,4 |
5,2 |
501,76 |
116,48 |
27,04 |
6,03994 |
0,705499 |
1,22459 |
0,07111 |
25 |
10 |
25,1 |
5,8 |
630,01 |
145,58 |
33,64 |
6,637502 |
0,70141 |
2,90420 |
0,75112 |
59,29 |
11 |
29 |
7,9 |
841 |
229,1 |
62,41 |
7,50065 |
0,15948 |
6,59113 |
8,80113 |
134,56 |
12 |
32,9 |
9,8 |
1082,41 |
322,42 |
96,04 |
8,363798 |
2,06268 |
11,76811 |
23,68448 |
240,25 |
|
208,8
|
59,2
|
4686
|
1263,1
|
348,78
|
59,20005
|
5,12884
|
51,57274
|
56,72665
|
1052,88
|
Найдем оценки параметров , из системы нормальных уравнений линейной зависимости, которая имеет следующий вид:
Отсюда можно выразить , [1]
:
Необходимые суммы рассчитаны в табл. 1 в столбцах 2 - 5.
Занесем полученные ответы в табл. 4.
Подставим рассчитанные значения , в уравнение (1) и запишем линейную модель в виде:
. (2)
3
. Оценим тесноту взаимосвязи между признаками с помощью выборочного линейного коэффициента корреляции:
.
Заполним столбец 6 и подставим рассчитанные суммы из табл. 1.
0,95348.
Проверим значимость выборочного коэффициента корреляции. Для этого выдвигаем нулевую гипотезу Н
0
об отсутствии линейной зависимости между признаками Х
и Y
, т.е.
Н
0
: r
г
= 0,
Н
1
: r
г
¹ 0.
Конкурирующая гипотеза Н
1
определяет двустороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины
Т
=, которая имеет распределение Стьюдента с
k
= 12
– 2 = 10 степенями свободы.
По выборочным данным найдем
Т
н
== 10,00181.
По таблице критических точек распределения Стьюдента (прил. 1) находим
t
кр.дв
(a; k
) = t
кр.дв
(0,1; 10) = 1,81
(на пересечении строки k
= 10 и уровня значимости a=
0,1).
Сравниваем Т
н
и t
кр.дв
(a; k
). Так как |Т
н
| > t
кр.дв
(a; k
), то Т
н
попало в критическую область. Следовательно, нулевая гипотеза об отсутствии линейной связи между темпом прироста капиталовложений и выпуском валовой продукции отвергается при 10-процентном уровне значимости.
Справедлива конкурирующая гипотеза Н
1
: r
г
¹ 0,r
в
значим, признаки Х
и Y
коррелированы.
Коэффициент корреляции r
в
по модулю больше 0,7, значит, связь между признаками тесная, а положительный знак r
в
указывает на прямую зависимость между темпом прироста капиталовложений и выпуском валовой продукции, что подтверждается экономической теорией.
4
. Рассчитаем выборочный коэффициент детерминации . Для этого возведем коэффициент корреляции r
в
в квадрат:
= (r
в
)2
= (0,95348)2
= 0,909124.
Коэффициент детерминации характеризует вариацию признака Y
, объясненную линейным уравнением регрессии. Таким образом, в среднем 90,91% вариации выпуска валовой продукции объясняется вариацией темпа прироста капиталовложений, а 9,09% зависит от вариации не учтенных в модели факторов.
5
. Проверим значимость оценки параметра регрессии с помощью критерия Стьюдента. Выдвигаем нулевую гипотезу о равенстве нулю коэффициента регрессии:
Н
0
: b
= 0,
Н
1
: b
0.
Конкурирующая гипотеза Н
1
определяет двустороннюю критическую область.
Данная гипотеза Н
0
проверяется с помощью случайной величины
=, которая имеет распределение Стьюдента с k
= 12
– 2 = 10 степенями свободы.
Заполняем столбцы 7 и 8 табл. 1. Для того чтобы найти , надо значения фактора (столбец 2 табл. 1) подставить в уравнение (2).
Предварительно найдем стандартную ошибку коэффициента регрессии по формуле
,
где – это несмещенная оценка остаточной дисперсии , она равна
(табл. 1, столбец 8).
Тогда стандартная ошибка регрессии
(занесем этот результат в табл. 4).
Дисперсия объясняющего фактора Х
вычисляется по формуле
== 87,74.
Итак, 0,02207.
Найдем наблюдаемое значение критерия Стьюдента:
= .
Заносим два последних ответа в табл. 4. По таблице критических точек распределения Стьюдента (прил. 1) находим
t
кр.дв
(a; k
) = t
кр.дв
(0,1; 10) = 1,81.
Сравниваем || и t
кр.дв
(a; k
). Так как || > t
кр.дв
(a; k
), то попало в критическую область. Следовательно, нулевая гипотеза о незначимости коэффициента регрессии отвергается при 10-процентном уровне значимости. Справедлива конкурирующая гипотеза Н
1
: b
¹ 0,оценка параметра
статистически значима, признаки Х
и Y
взаимосвязаны.
Таким образом, если прирост капиталовложений увеличится на 1%, то выпуск валовой продукции увеличится в среднем на 0,22132 млн.руб.
6
. Построим доверительный интервал для коэффициента регрессии b
.
– t
кр.дв
(α; k
)+ t
кр.дв
(α; k
).
Подставляем значения из п. 5:
,
(заносим результат в табл. 4).
Таким образом, при увеличении темпа прироста капиталовложений на 1% выпуск валовой продукции увеличится в среднем с 0,18 до 0,26 млн. руб.
7
. Проверим значимость оценки параметра с помощью критерия Стьюдента. Выдвигаем нулевую гипотезу о незначимости свободного члена уравнения.
Н
0
: а
= 0,
Н
1
: а
0.
Конкурирующая гипотеза Н
1
определяет двустороннюю критическую область.
Данная гипотеза Н
0
проверяется с помощью случайной величины
=, которая имеет распределение Стьюдента с k
= 12
– 2 = 10 степенями свободы.
Предварительно найдем стандартную ошибку по формуле
.
Найдем наблюдаемое значение критерия Стьюдента
= .
Заносим ответы и в табл. 4. По таблице критических точек распределения Стьюдента (прил. 1) находим
t
кр.дв
(a; k
) = t
кр.дв
(0,1; 10) = 1,81.
Сравниваем || и t
кр.дв
(a; k
). Так как || > t
кр.дв
(a; k
), то попало в критическую область. Следовательно, нулевая гипотеза о незначимости свободного члена отвергается при 10-процентном уровне значимости. Справедлива конкурирующая гипотеза Н
1
: а
¹ 0,оценка параметра
статистически значима.
8
. Построим доверительный интервал для свободного члена уравнения:
– t
кр.дв
.
(α; k
)+ t
кр.дв
.
(α; k
).
Подставляем значения из п. 7:
,
(вносим в табл. 4).
Границы доверительного интервала имеют одинаковые знаки, поэтому линейную модель оставляем в общем виде[2]
: .
9
. Построим таблицу дисперсионного анализа по общей схеме (табл. 2).
Таблица 2
|
Источник вариации |
Число степеней свободы |
Сумма квадратов отклонений |
Дисперсия на одну степень свободы |
F
н
|
df
|
SS
|
MS
|
F
– статистика |
Регрессия |
1 |
RSS
= |
|
|
Остаток |
n
– 2 |
ESS
= |
|
Итого |
n
– 1 |
TSS
= |
Сначала найдем среднее значение признака Y
:
=59,2= 4,93333(3).
Затем в табл. 1 заполним столбцы 9 и 10.
RSS
=– регрессионная сумма квадратов отклонений.
ESS
=– остаточная сумма квадратов отклонений.
TSS
=
RSS
+
ESS
– общая сумма квадратов отклонений.
F
– статистика рассчитана по формуле F
= .
Таблица 3
|
Источник вариации |
Число степеней свободы |
Сумма квадратов отклонений |
Дисперсия на одну степень свободы |
F
н
|
df
|
SS
|
MS
|
F
– статистика |
Регрессия |
1 |
51,57274 |
0,512884 |
100,55439 |
Остаток |
10 |
5,12884 |
Итого |
11 |
56,7 |
10
. Оценим значимость линейной модели в целом при 10-процентном уровне значимости. Выдвигаем гипотезу о незначимости линейной модели.
Н
0
: модель незначима,
Н
1
: модель значима.
Конкурирующая гипотеза Н
1
определяет правостороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины F
, которая имеет распределение Фишера – Снедекора с и степенями свободы.
Наблюдаемое значение критерия берем из схемы дисперсионного анализа (табл. 3): . Критическое значение критерия смотрим в таблице критических точек Фишера – Снедекора (прил. 2)
F
кр
(α; k
1
; k
2
) = F
кр
(0,1; 1; 10) = 3,29
(на пересечении строки k
2
= 10 и уровня значимости α = 0,1).
Сравниваем F
н
и F
кр
(α; k
1
; k
2).
Так как F
н
>> F
кр
(α; k
1
; k
2
), то F
н
попало в критическую область. Следовательно, нулевая гипотеза о незначимости линейной модели отвергается при 10-процентном уровне значимости. Справедлива конкурирующая гипотеза Н
1
, следовательно, модель значима и ее можно использовать для прогноза.
11.
Спрогнозируем процент расходов на питание при темпе прироста капиталовложений =15%. Для этого подставим в уравнение регрессии (2):
.
Таким образом, если темп прироста капиталовложений будет равен 15%, выпуск валовой продукции составит в среднем 4,4 млн.руб.
Построим 90-процентный доверительный интервал прогноза:
– t
кр.дв
(α; k
)+ t
кр.дв
(α; k
).
Предварительно заполним столбец 11 (см. табл. 1) и найдем стандартную ошибку прогноза :
,
где
= – среднее значение дохода Х
.
Итак, (табл. 4).
Подставляем найденные значения в формулу доверительного интервала:
.
(табл. 4).
Таким образом, если темп прироста капиталовложений буде равен 15%, то выпуск валовой продукции будет колебаться в среднем от 3,04 до 5,76 млн.
12
. Найдем средний коэффициент эластичности:
.
Таким образом, с увеличением темпа прироста капиталовложений на 1% выпуск валовой продукции увеличится в среднем на 0,7806 млн.руб.
13
. Проверим гипотезу о равенстве параметра b
некоторому теоретическому значению b
0
. Примем b
0
= 0,25, так как = 0,22 ≈ 0,25.
Н
0
: b
= 0,25,
Н
1
: b
0,25.
Конкурирующая гипотеза Н
1
определяет двустороннюю критическую область.
Данная гипотеза проверяется с помощью случайной величины
=, которая имеет распределение Стьюдента с
k
=
n
– 2 = 10 степенями свободы.
Стандартная ошибка коэффициента регрессии = 0,02207 (см. п. 5).
По выборочным данным найдем
= .
По таблице критических точек распределения Стьюдента (прил. 1) находим t
кр.дв
(a; k
) = t
кр.дв
(0,1; 10) = 1,81.
Сравниваем || и t
кр.дв
(a; k
). Так как || < t
кр.дв
(a; k
), то попало в область принятия гипотезы. Следовательно, нулевая гипотеза принимается при уровне значимости α = 0.1, Н
0
: b
=0,25
. Таким образом, b
0
и b
различаются несущественно.
14
. На поле корреляции построим график уравнения линейной регрессии (рис. 2). Графиком является прямая, которую можно построить по данным столбцов 2 и 7 (см. табл. 1).
Рис.2
y
=1,08+0,22
x
Коэффициент детерминации() – 0,909
Таблица 4
|
Показатели |
Оценки |
Стандартные
ошибки (s
)
|
Т
н
|
Доверительные
интервалы
|
Нижняя граница |
Верхняя граница |
Свободный член а
|
1,08 |
= 0,44 |
2,48 |
0,29 |
1,87 |
Коэффициент регрессии b
|
0,22 |
= 0,02 |
10,0 |
0,18 |
0,26 |
Прогноз
|
4,4 |
= 0,75 |
3,04 |
5,76 |
Уравнение
регрессии
|
|
= 0,72 |
[1]
Пределы суммирования постоянны, поэтому суммубудем обозначать знаком.
[2]
Если при сравнении || < t
кр.дв
(a; k
), то попадает в область принятия гипотезы и нулевая гипотеза Н
0
: а
= 0 принимается, аоценка параметра
считаетсястатистически незначимой. Тогда модель можно записать в виде.
|