Московский Государственный Университет Экономики, Статистики и Информатики
Контрольная работа по дисциплине «Многомерные статистические методы»
Выполнила студентка:
Группы ЗСС-301
Елисеенкова Елена
№ зачетной книжки: 99183
Москва 2001.
Содержание
Экономическая постановка задачи_____________________________________________ 3
Методика многомерного статистического исследования_________________________ 4
Корреляционный и регрессионный анализ.____________________________________ 4
Компонентный анализ.______________________________________________________ 5
Интерпретация результатов исследования_____________________________________ 7
Заключение_________________________________________________________________ 17
Список использованной литературы__________________________________________ 18
Экономическая постановка задачи
В данной работе с помощью пакета прикладных программ «Олимп» исследовано влияние нескольких независимых факторов на один зависимый. В данном случае рассматривается зависимость рентабельности (%) от следующих факторов:
- Трудоемкость единицы продукции (чел./час);
- удельный вес рабочих в составе промышленно-производственного персонала;
- удельный вес покупных изделий;
- коэффициент сменности оборудования (число смен/1 станок);
- премии и вознаграждения на одного работника в % к заработной плате (%);
- удельный вес потерь от брака (%).
Проведем анализ содержательного смысла исследуемых признаков.
Рентабельность - это отношение валовой или чистой прибыли к среднегодовому объему основных и оборотных фондов. Производительность труда отражает окупаемость затрат на производство данной продукции или услуг, помогает определить выгоду от данного производства.
Трудоемкость единицы продукции - это затраты рабочего времени на производство единицы продукции. Показатель трудоемкости является обратным показателю производительности труда.
Удельный вес рабочих в составе промышленно-производственного персонала - фактор, определяющий состав промышленно-производственного персонала. Удельный вес рабочих (%) имеет влияние на производительность труда, правда меньшее, чем другие факторы.
Удельный вес покупных изделий (%) имеет влияние на прибыль, полученную от производство продукции или услуг.
Коэффициент сменности оборудования показывает какое количество смен работает один станок. Он позволяет оценить окупаемость оборудования и его производительность.
Премии и вознаграждения на одного работника в % к заработной плате относятся к группе экономических факторов. Влияние данного фактора на производительность труда очевидно. Понятно, что увеличение материальной заинтересованности работника создает стимул для улучшения качества и производительности выполняемой работы, то есть наблюдается прямая зависимость. Увеличение доли нестабильных элементов заработной платы, или, иначе говоря, премий и вознаграждений относят к наиболее типичным формам и принципам оплаты труда и материального стимулирования. Этот фактор является компонентом внешней мотивации труда, которая оказывает очень сильное воздействие на производительность труда.
Удельный вес потерь от брака – это вес единицы объема брака. Он помогает определить количество брака данной продукции и произошедшие вследствие этого потери. Дает возможность вовремя исправлять ошибки, связанные, например, с неисправностью оборудования.
Методика многомерного статистического исследования
Корреляционный и регрессионный анализ.
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методом корреляционного и регрессионного анализа.
Термин «корреляция» произошел от латинского «correlation» - соотношение. Термин «регрессия» также латинского происхождения и означает обратное движение. В настоящее время в этот термин вкладывается совершенно другой смысл.
Две случайные величины имеют корреляционную связь, если математическое ожидание одной из них изменяется в зависимости от изменения другой. Метод математической статистики, изучающий связи между явлениями, называется корреляционным анализом. Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии и силе корреляционной связи.
Существуют следующие виды корреляционной связи.
1) Относительно числа переменных, включенных в корреляционную модель, различают:
- парную корреляционную связь двух величин;
- множественную корреляцию.
2) Относительно характера корреляционной связи различают:
- положительную корреляцию;
- отрицательную корреляцию.
3) Относительно формы связи различают:
- линейную корреляцию;
- нелинейную корреляцию.
Не все факторы, влияющие на экономические процессы, являются случайными величинами. Поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
Задачами регрессионного анализа являются
а) установление формы зависимости;
б) определение функции регрессии и на этой основе установление характера и степени влияния аргументов на функцию.
Существуют следующие виды регрессии.
1) Относительно числа переменных, включенных в регрессионную модель различают:
- парную регрессию;
- множественную регрессию.
2) Относительно характера регрессионной связи различают:
- положительную регрессию;
- отрицательную регрессию.
3) Относительно формы зависимости различают:
- линейную регрессию;
- нелинейную регрессию.
Сущность корреляционного и регрессионного методов анализа состоит в усреднении значений включенных в модель переменных, которые имеют количественное выражение.
Корреляционный и регрессионный анализ тесно связаны между собой. В практике современного статистического анализа они не могут существовать друг без друга. Это и понятно, поскольку оценка степени и силы связи без последующего моделирования взаимосвязи не представляет особого интереса, а само моделирование зависимости осуществляется на основе использования различных показателей корреляции как для предварительного анализа информации, так и для характеристики адекватности модели.
Рассмотрим выделенные этапы более подробно:
1. Формулировка экономической задачи.
На этом этапе формируются теоретические гипотезы о зависимости экономических явлений, устанавливаются объект и период исследования. В корреляционном анализе здесь же выявляются переменные, связь между которыми подлежит оценке.
В регрессионном анализе выявляются причинно-следственные отношения между переменными на основе изложения сущности изучаемого экономического явления.
2. Сбор и анализ исходной информации.
В соответствии с целью исследования устанавливают, какой вид статистического наблюдения следует использовать. Здесь важно отметить, что выводы, полученные в результате анализа выборочной совокупности, с предельной вероятностью можно распространить на всю генеральную совокупность при условии, что выборка репрезентативна (т.е. в выборочной совокупности достоверно отражены все тенденции, имеющие место в генеральной совокупности).
Анализ исходной информации осуществляется с целью определения ее качества, от которого во многом зависят результаты как корреляционного, так и регрессионного анализа. Исходная информация должна быть достоверна, иметь количественное выражение и быть достаточной по количеству.
В регрессионном анализе в соответствии с сформулированной целью исследования и после анализа исходной информации производится выбор зависимой и объясняющей переменных, которые необходимо включить в модель.
3. Проверка предпосылок корреляционного и регрессионного анализа.
После того как собранные исходные данные будут очищены от аномальных наблюдений, следует провести проверку, насколько оставшаяся информация удовлетворяет предпосылкам для использования статистического аппарата при построении моделей, так как даже незначительные отступления от этих предпосылок часто сводят к нулю получаемый эффект. В связи с этим вероятностно-статистическое решение любой экономической задачи должно основываться на подробном осмыслении исходных математических понятий и предпосылок, корректности и объективности сбора исходного статистического материала, постоянном сочетании и тесной связи экономического и математико-статистического анализа.
Для применения корреляционного анализа необходимо, чтобы все рассматриваемые переменные были случайными и имели нормальный закон распределения. Причем выполнение этих двух условий необходимо только при вероятностной оценке выявленной тесноты связи.
4. Экономическая интерпретация результатов
осуществляется на основе содержательного истолкования полученных в ходе анализа результатов.
Компонентный анализ.
В зависимости от конкретных задач, решаемых в экономике, каждый из методов факторного анализа, в том числе метод главных компонент, имеют свои достоинства и недостатки. Компонентный анализ считается статистическим методом. Однако, есть другой подход, приводящий к компонентному анализу, но не являющийся статистическим. Этот подход связан с получением наилучшей проекции точек наблюдения в пространстве меньшей размерности. В статистическом подходе задача будет заключаться в выделении линейных комбинаций случайных величин, имеющих максимально возможную дисперсию. Он опирается на ковариационную и корреляционную матрицу этих величин. У этих двух разных подходов есть общий аспект: использование матрицы вторых моментов как исходной для начала анализа.
Методы факторного анализа позволяют решать следующие четыре задачи.
Первая заключается в «сжатии» информации до обозримых размеров, т.е. извлечения из исходной информации наиболее существенной части за счет перехода от системы исходных переменных к системе обобщенных факторов. При этом выявляются неявные, непосредственно не измененные, но объективно существующие закономерности, обусловленные действием как внутренних, так и внешних причин.
Вторая сводится к описанию исследуемого явления значительно меньшим числом m обобщенных факторов (главных компонент) по сравнению с числом исходных признаков. Обобщенные факторы – это новые единицы измерения свойств явления, непосредственно измеряемых признаков.
Третья – связана с выявлением взаимосвязи наблюдаемых признаков с вновь полученными обобщенными факторами.
Четвертая заключается в построении уравнения регрессии на главных компонентах с целью прогнозирования изучаемого явления.
Компонентный анализ может быть также использован при классификации наблюдений (объектов). В экономических исследованиях стремление полнее изучить исследуемое явление приводит к включению в модуль все большего числа исходных переменных, которые зачастую отражают одни и те же свойства объема наблюдения. Это приводит к высокой корреляции между переменными, т.е. к явлению мультиколлинеарности. При этом классические методы регрессионного анализа оказываются малоэффективными. Преимущество уравнения регрессии на главные компоненты в том, что последние не коррелированны между собой.
Главные компоненты являются характеристическими векторами ковариационной матрицы.
Множество главных компонент представляет собой удобную систему координат, а их вклад в общую дисперсию характеризует статистические свойства главных компонент. Из общего числа главных компонент для исследования, как правило, оставляют наиболее весомых, т.е. вносящих максимальный вклад в объясняемую часть общей дисперсии.
Таким образом, несмотря на то, что в методе главных компонент надо для точного воспроизведения корреляции и дисперсии между переменными найти все компоненты, большая доля дисперсии объясняется небольшим числом главных компонент. Кроме того, можно по признакам описать факторы, а по факторам (главным компонентам) описать признаки.
Интерпретация результатов исследования
Для исследования использовались следующие данные:
Исходные данные для анализа
N
|
Y2
|
X4
|
X5
|
X6
|
X7
|
X8
|
X9
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
13.26
10.16
13.72
12.85
10.63
9.12
25.83
23.38
14.68
10.05
13.99
9.68
10.03
9.13
5.37
9.86
12.62
5.02
21.18
25.17
19.1
21.0
6.57
14.19
15.81
5.23
7.99
17.5
17.16
14.54
|
0.23
0.24
0.19
0.17
0.23
0.43
0.31
0.26
0.49
0.36
0.37
0.43
0.35
0.38
0.42
0.30
0.32
0.25
0.31
0.26
0.37
0.29
0.34
0.23
0.17
0.29
0.41
0.41
0.22
0.29
|
0.78
0.75
0.68
0.70
0.62
0.76
0.73
0.71
0.69
0.73
0.68
0.74
0.66
0.72
0.68
0.77
0.78
0.78
0.81
0.79
0.77
0.78
0.72
0.79
0.77
0.80
0.71
0.79
0.76
0.78
|
0.40
0.26
0.40
0.50
0.40
0.19
0.25
0.44
0.17
0.39
0.33
0.25
0.32
0.02
0.06
0.15
0.08
0.20
0.20
0.30
0.24
0.10
0.11
0.47
0.53
0.34
0.20
0.24
0.54
0.40
|
1.37
1.49
1.44
1.42
1.35
1.39
1.16
1.27
1.16
1.25
1.13
1.10
1.15
1.23
1.39
1.38
1.35
1.42
1.37
1.41
1.35
1.48
1.24
1.40
1.45
1.40
1.28
1.33
1.22
1.28
|
1.23
1.04
1.80
0.43
0.88
0.57
1.72
1.70
0.84
0.60
0.82
0.84
0.67
1.04
0.66
0.86
0.79
0.34
1.60
1.46
1.27
1.58
0.68
0.86
1.98
0.33
0.45
0.74
1.03
0.99
|
0.23
0.39
0.43
0.18
0.15
0.34
0.38
0.09
0.14
0.21
0.42
0.05
0.29
0.48
0.41
0.62
0.56
1.76
1.31
0.45
0.50
0.77
1.20
0.21
0.25
0.15
0.66
0.74
0.32
0.89
|
Далее был проведен на исходные данные корреляционный анализ. Были получены следующие результаты.
Матрица
┌─────┬───────┬───────┬───────┬───────┬───────┬───────┬───────┐
│ N │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │
│ x4 │ 1.00 │ -0.14 │ -0.65 │ -0.54 │ -0.38 │ 0.01 │ -0.21 │
│ x5 │ -0.14 │ 1.00 │ -0.05 │ 0.39 │ 0.13 │ 0.35 │ 0.24 │
│ x6 │ -0.65 │ -0.05 │ 1.00 │ 0.06 │ 0.20 │ -0.43 │ 0.24 │
│ x7 │ -0.54 │ 0.39 │ 0.06 │ 1.00 │ 0.15 │ 0.20 │ -0.02 │
│ x8 │ -0.38 │ 0.13 │ 0.20 │ 0.15 │ 1.00 │ -0.09 │ 0.76 │
│ x9 │ 0.01 │ 0.35 │ -0.43 │ 0.20 │ -0.09 │ 1.00 │ -0.09 │
│ y2 │ -0.21 │ 0.24 │ 0.24 │ -0.02 │ 0.76 │ -0.09 │ 1.00 │
└─────┴───────┴───────┴───────┴───────┴───────┴───────┴───────┘
t-значения
┌─────┬───────┬───────┬───────┬───────┬───────┬───────┬───────┐
│ N │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │
├─────┼───────┼───────┼───────┼───────┼───────┼───────┼───────┤
│ x4 │ 1.00 │ 0.75 │ 4.51 │ 3.42 │ 2.18 │ 0.05 │ 1.14 │
│ x5 │ 0.75 │ 1.00 │ 0.25 │ 2.25 │ 0.68 │ 2.00 │ 1.32 │
│ x6 │ 4.51 │ 0.25 │ 1.00 │ 0.29 │ 1.09 │ 2.49 │ 1.30 │
│ x7 │ 3.42 │ 2.25 │ 0.29 │ 1.00 │ 0.82 │ 1.06 │ 0.13 │
│ x8 │ 2.18 │ 0.68 │ 1.09 │ 0.82 │ 1.00 │ 0.46 │ 6.12 │
│ x9 │ 0.05 │ 2.00 │ 2.49 │ 1.06 │ 0.46 │ 1.00 │ 0.48 │
│ y2 │ 1.14 │ 1.32 │ 1.30 │ 0.13 │ 6.12 │ 0.48 │ 1.00 │
└─────┴───────┴───────┴───────┴───────┴───────┴───────┴───────┘
Кpитические значения t-pаспpеделения пpи 28 степенях свободы
веpоятность t-значение
0.950 1.706
0.990 2.470
0.999 3.404
Доверительные интервалы
┌─────┬───────┬───────┬───────┬───────┬───────┬───────┬───────┐
│ N │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │
├─────┼───────┼───────┼───────┼───────┼───────┼───────┼───────┤
│ x4 │ 0.00 │ 0.17 │ -0.43 │ -0.28 │ -0.08 │ 0.32 │ 0.10 │
│ x4 │ 0.00 │ -0.43 │ -0.80 │ -0.73 │ -0.62 │ -0.30 │ -0.49 │
│ x5 │ 0.17 │ 0.00 │ 0.26 │ 0.62 │ 0.42 │ 0.60 │ 0.51 │
│ x5 │ -0.43 │ 0.00 │ -0.35 │ 0.10 │ -0.19 │ 0.05 │ -0.07 │
│ x6 │ -0.43 │ 0.26 │ 0.00 │ 0.36 │ 0.48 │ -0.14 │ 0.51 │
│ x6 │ -0.80 │ -0.35 │ 0.00 │ -0.26 │ -0.11 │ -0.65 │ -0.07 │
│ x7 │ -0.28 │ 0.62 │ 0.36 │ 0.00 │ 0.44 │ 0.48 │ 0.28 │
│ x7 │ -0.73 │ 0.10 │ -0.26 │ 0.00 │ -0.16 │ -0.12 │ -0.33 │
│ x8 │ -0.08 │ 0.42 │ 0.48 │ 0.44 │ 0.00 │ 0.23 │ 0.86 │
│ x8 │ -0.62 │ -0.19 │ -0.11 │ -0.16 │ 0.00 │ -0.38 │ 0.59 │
│ x9 │ 0.32 │ 0.60 │ -0.14 │ 0.48 │ 0.23 │ 0.00 │ 0.22 │
│ x9 │ -0.30 │ 0.05 │ -0.65 │ -0.12 │ -0.38 │ 0.00 │ -0.39 │
│ y2 │ 0.10 │ 0.51 │ 0.51 │ 0.28 │ 0.86 │ 0.22 │ 0.00 │
│ y2 │ -0.49 │ -0.07 │ -0.07 │ -0.33 │ 0.59 │ -0.39 │ 0.00 │
└─────┴───────┴───────┴───────┴───────┴───────┴───────┴───────┘
прогноз
по
регрессии
НЕТ
┌1────┬──────────────────────────────────────────────────┬────────┐
│ N │ k k k k k k k k k k╞ k° кdYь │ .Ў5 │
├─────┼──────────────────────────────────────────────────┼────────┤
│ x4 │ 0.87 │ 10.12 │
│ x5 │ 0.60 │ 1.74 │
│ x6 │ 0.84 │ 7.37 │
│ x7 │ 0.74 │ 3.83 │
│ x8 │ 0.82 │ 6.35 │
│ x9 │ 0.64 │ 2.19 │
│ y2 │ 0.81 │ 6.11 │
└─────┴──────────────────────────────────────────────────┴────────┘
Анализируя полученные результаты, при tкр
=1,706 с вероятностью 0,95 можно утверждать, что рентабельность имеет наибольшую зависимость от следующих факторов: удельного веса покупных изделий, коэффициента сменности оборудования и от премий и вознаграждений на одного работника в % к заработной плате и меньше всего зависит от удельного веса потерь от брака и от удельного веса рабочих в составе промышленно-производственного персонала.
Потом провели анализ с помощью линейной регрессии. Приведем протокол множественной линейной регрессии.
*** Протокол множественной линейной регрессии ***
Зависимая переменная Y - y2
Функция Y = -12.728+12.035*x4+28.237*x5+8.948*x6-8.160*x7+9.757*x8+0.259*x9
Оценки коэффициентов линейной регрессии
┌───┬──────────┬───────────┬───────────────┬───────────┬────────┬─────────┐
│ N │ Значение │ Дисперсия │ Средне- │ t - │ Нижняя │ Верхняя │
│ │ │ │ квадатическое │ значение │ оценка │ оценка │
│ │ │ │ отклонение │ │ │ │
├───┼──────────┼───────────┼───────────────┼───────────┼────────┼─────────┤
│ 1 │ -12.73 │ 337.23 │ 18.36 │ -0.69 │ -44.29 │ 18.83 │
│ 2 │ 12.04 │ 285.68 │ 16.90 │ 0.71 │ -17.01 │ 41.08 │
│ 3 │ 28.24 │ 301.19 │ 17.35 │ 1.63 │ -1.59 │ 58.06 │
│ 4 │ 8.95 │ 76.52 │ 8.75 │ 1.02 │ -6.09 │ 23.98 │
│ 5 │ -8.16 │ 88.27 │ 9.39 │ -0.87 │ -24.31 │ 7.99 │
│ 6 │ 9.76 │ 2.95 │ 1.72 │ 5.68 │ 6.80 │ 12.71 │
│ 7 │ 0.26 │ 5.56 │ 2.36 │ 0.11 │ -3.79 │ 4.31 │
└───┴──────────┴───────────┴───────────────┴───────────┴────────┴─────────┘
Кpитические значения t-pаспpеделения
пpи 23 степенях свободы
веpоятность t-значение
0.900 1.323
0.950 1.719
0.990 2.503
Т.к. значение
t
при х9 (самое маленькое из полученных) меньше
t
кр – мы его исключаем. И проводим анализ еще раз.
ШАГ 2
*** Протокол множественной линейной регрессии ***
Зависимая переменная Y - y2
Функция Y = -12.473+11.313*x4+28.935*x5+8.418*x6-8.337*x7+9.719*x8
Оценки коэффициентов линейной регрессии
┌───┬──────────┬───────────┬───────────────┬───────────┬────────┬─────────┐
│ N │ Значение │ Дисперсия │ Средне- │ t - │ Нижняя │ Верхняя │
│ │ │ │ квадатическое │ значение │ оценка │ оценка │
│ │ │ │ отклонение │ │ │ │
├───┼──────────┼───────────┼───────────────┼───────────┼────────┼─────────┤
│ 1 │ -12.47 │ 318.15 │ 17.84 │ -0.70 │ -43.07 │ 18.13 │
│ 2 │ 11.31 │ 232.53 │ 15.25 │ 0.74 │ -14.85 │ 37.48 │
│ 3 │ 28.93 │ 250.19 │ 15.82 │ 1.83 │ 1.80 │ 56.07 │
│ 4 │ 8.42 │ 51.07 │ 7.15 │ 1.18 │ -3.84 │ 20.68 │
│ 5 │ -8.34 │ 82.14 │ 9.06 │ -0.92 │ -23.89 │ 7.21 │
│ 6 │ 9.72 │ 2.71 │ 1.65 │ 5.90 │ 6.89 │ 12.54 │
└───┴──────────┴───────────┴───────────────┴───────────┴────────┴─────────┘
Кpитические значения t-pаспpеделения
пpи 24 степенях свободы
веpоятность t-значение
0.900 1.321
0.950 1.716
0.990 2.495
Т.к. значение
t
при х4 (самое маленькое из полученных на втором шаге) меньше
t
кр – мы его исключаем. И проводим анализ еще раз.
ШАГ 3
*** Протокол множественной линейной регрессии ***
Зависимая переменная Y - y2
Функция Y = -2.485+30.026*x5+4.567*x6-12.718*x7+9.316*x8
Оценки коэффициентов линейной регрессии
┌───┬──────────┬───────────┬───────────────┬───────────┬────────┬─────────┐
│ N │ Значение │ Дисперсия │ Средне- │ t - │ Нижняя │ Верхняя │
│ │ │ │ квадатическое │ значение │ оценка │ оценка │
│ │ │ │ отклонение │ │ │ │
├───┼──────────┼───────────┼───────────────┼───────────┼────────┼─────────┤
│ 1 │ -2.49 │ 134.48 │ 11.60 │ -0.21 │ -22.35 │ 17.38 │
│ 2 │ 30.03 │ 243.57 │ 15.61 │ 1.92 │ 3.29 │ 56.76 │
│ 3 │ 4.57 │ 23.69 │ 4.87 │ 0.94 │ -3.77 │ 12.90 │
│ 4 │ -12.72 │ 46.42 │ 6.81 │ -1.87 │ -24.39 │ -1.05 │
│ 5 │ 9.32 │ 2.37 │ 1.54 │ 6.05 │ 6.68 │ 11.96 │
└───┴──────────┴───────────┴───────────────┴───────────┴────────┴─────────┘
Кpитические значения t-pаспpеделения
пpи 25 степенях свободы
веpоятность t-значение
0.900 1.319
0.950 1.713
0.990 2.488
Т.к. значение
t
при х6 (самое маленькое из полученных на третьем шаге) меньше
t
кр – мы его исключаем. И проводим анализ еще раз.
ШАГ 4
*** Протокол множественной линейной регрессии ***
Зависимая переменная Y - y2
Функция Y = -0.990+28.691*x5-12.346*x7+9.610*x8
Оценки коэффициентов линейной регрессии
┌───┬──────────┬───────────┬───────────────┬───────────┬────────┬─────────┐
│ N │ Значение │ Дисперсия │ Средне- │ t - │ Нижняя │ Верхняя │
│ │ │ │ квадатическое │ значение │ оценка │ оценка │
│ │ │ │ отклонение │ │ │ │
├───┼──────────┼───────────┼───────────────┼───────────┼────────┼─────────┤
│ 1 │ -0.99 │ 131.34 │ 11.46 │ -0.09 │ -20.59 │ 18.61 │
│ 2 │ 28.69 │ 240.44 │ 15.51 │ 1.85 │ 2.17 │ 55.21 │
│ 3 │ -12.35 │ 46.05 │ 6.79 │ -1.82 │ -23.95 │ -0.74 │
│ 4 │ 9.61 │ 2.27 │ 1.51 │ 6.38 │ 7.04 │ 12.18 │
└───┴──────────┴───────────┴───────────────┴───────────┴────────┴─────────┘
Кpитические значения t-pаспpеделения
пpи 26 степенях свободы
веpоятность t-значение
0.900 1.318
0.950 1.710
0.990 2.482
Так как все t-значения полученного уравнения регрессии больше tкр
= 1,318, то с вероятностью 0,90 можно утверждать что уравнение регрессии значимо, и результатирующий признак (рентабельность) имеет напрямую зависит от следующих факторов: удельный вес рабочих в составе промышленно-производственного персонала, коэффициент сменности оборудования и премии и вознаграждения на одного работника в % к заработной плате, как было отмечено выше и доказано данным уравнением, имеет обратную зависимость с удельным весом потерь от брака, трудоемкостью единицы продукции и удельным весом покупных изделий.
Анализируя полученное уравнение регрессии, можно сделать вывод, что при увеличении удельного веса рабочих в составе промышленно-производственного персонала на 1% рентабельность увеличивается на 28,691%, а при увеличении коэффициента сменности оборудования на 1 рентабельность уменьшается на 12,346%, если же мы увеличим премии и вознаграждения на одного работника на 1%, то рентабельность увеличится на 9,610%.
Оценки коэффициентов интерпретации линейной регрессии
╔════╤════════╤═════════╤═════════╗
║ N │Коэффиц.│Вета- │Дельта- ║
║ │эластичн│коэффиц. │коэффиц. ║
╠════╪════════╪═════════╪═════════╣
║1 │ +1.575│ +0.237│ +0.090║
║2 │ -1.210│ -0.234│ +0.009║
║3 │ +0.707│ +0.762│ +0.901║
╚════╧════════╧═════════╧═════════╝
Таблица остатков
┌────┬──────────────┬───────────┬────────────┬───────────────┐
│ N │ Эмпирическое │ Расчетное │ Ошибка │ Ошибка │
│ │ значение │ значение │ абсолютная │ относительная │
├────┼──────────────┼───────────┼────────────┼───────────────┤
│ 1 │ 13.26 │ 16.29 │ -3.03 │ -0.23 │
│ 2 │ 10.16 │ 12.13 │ -1.97 │ -0.19 │
│ 3 │ 13.72 │ 18.04 │ -4.32 │ -0.31 │
│ 4 │ 12.85 │ 5.69 │ 7.16 │ 0.56 │
│ 5 │ 10.63 │ 8.59 │ 2.04 │ 0.19 │
│ 6 │ 9.12 │ 9.13 │ -0.01 │ -0.00 │
│ 7 │ 25.83 │ 22.16 │ 3.67 │ 0.14 │
│ 8 │ 23.39 │ 20.04 │ 3.35 │ 0.14 │
│ 9 │ 14.68 │ 12.56 │ 2.12 │ 0.14 │
│ 10 │ 10.05 │ 10.29 │ -0.24 │ -0.02 │
│ 11 │ 13.99 │ 12.45 │ 1.54 │ 0.11 │
│ 12 │ 9.68 │ 14.73 │ -5.05 │ -0.52 │
│ 13 │ 10.03 │ 10.19 │ -0.16 │ -0.02 │
│ 14 │ 9.13 │ 14.48 │ -5.35 │ -0.59 │
│ 15 │ 5.37 │ 7.70 │ -2.33 │ -0.43 │
│ 16 │ 9.86 │ 12.33 │ -2.47 │ -0.25 │
│ 17 │ 12.62 │ 12.31 │ 0.31 │ 0.02 │
│ 18 │ 5.02 │ 7.12 │ -2.10 │ -0.42 │
│ 19 │ 21.18 │ 20.71 │ 0.47 │ 0.02 │
│ 20 │ 25.17 │ 18.30 │ 6.87 │ 0.27 │
│ 21 │ 19.10 │ 16.64 │ 2.46 │ 0.13 │
│ 22 │ 21.00 │ 18.30 │ 2.70 │ 0.13 │
│ 23 │ 6.57 │ 10.89 │ -4.32 │ -0.66 │
│ 24 │ 14.19 │ 12.66 │ 1.53 │ 0.11 │
│ 25 │ 15.81 │ 22.23 │ -6.42 │ -0.41 │
│ 26 │ 5.23 │ 7.85 │ -2.62 │ -0.50 │
│ 27 │ 7.99 │ 7.90 │ 0.09 │ 0.01 │
│ 28 │ 17.50 │ 12.37 │ 5.13 │ 0.29 │
│ 29 │ 17.16 │ 15.65 │ 1.51 │ 0.09 │
│ 30 │ 14.54 │ 15.10 │ -0.56 │ -0.04 │
└────┴──────────────┴───────────┴────────────┴───────────────┘
Характеристики остатков
Среднее значение..................... 0.000
Оценка дисперсии..................... 11.6
Оценка приведенной дисперсии........ 13.4
Средний модуль остатков.............. 2.730
Относительная ошибка аппроксимации... 0.232
Критерий Дарбина-Уотсона............. 1.692
Коэффициент детерминации............. 0.640
F - значение ( n1 = 4, n2 = 26)... 114
Гипотеза о значимости уравнения
не отвергается с вероятностью 0.950
Факторы, включенные в уравнение регрессии, объясняют 64% вариации уровня производительности труда.
Fрасч.
=114 > Fкр
=2,74 (n1= 4, n2=26), что доказывает значимость уравнения регрессии с вероятностью 0,95.
Потом был проведен факторный анализ. Приведем ниже протокол факторного анализа.
*** Протокол факторного анализа ***
1 шаг фактоpного анализа
┌───┬─────────────┬─────────────┐
│ N │ Собственные │ Накопленные │
│ │ значения │ отношения │
├───┼─────────────┼─────────────┤
│ 1 │ 2.43 │ 0.35 │
│ 2 │ 1.73 │ 0.59 │
│ 3 │ 1.33 │ 0.78 │
│ 4 │ 0.64 │ 0.88 │
│ 5 │ 0.56 │ 0.96 │
│ 6 │ 0.19 │ 0.98 │
│ 7 │ 0.11 │ 1.00 │
└───┴─────────────┴─────────────┘
Коэффициенты главных компонент
┌─────┬───────┬───────┬───────┬───────┬───────┬───────┬───────┐
│ N │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │
├─────┼───────┼───────┼───────┼───────┼───────┼───────┼───────┤
│ x4 │ 0.51 │ -0.04 │ 0.42 │ -0.21 │ -0.26 │ 0.18 │ -0.64 │
│ x5 │ -0.22 │ 0.53 │ 0.12 │ -0.75 │ -0.09 │ -0.29 │ 0.07 │
│ x6 │ -0.41 │ -0.37 │ -0.36 │ -0.34 │ 0.38 │ 0.11 │ -0.55 │
│ x7 │ -0.30 │ 0.44 │ -0.38 │ 0.24 │ -0.55 │ 0.35 │ -0.28 │
│ x8 │ -0.48 │ -0.06 │ 0.44 │ 0.37 │ -0.13 │ -0.56 │ -0.32 │
│ x9 │ 0.09 │ 0.61 │ 0.11 │ 0.28 │ 0.68 │ 0.11 │ -0.23 │
└─────┴───────┴───────┴───────┴───────┴───────┴───────┴───────┘
Матрица факторов (отобрано факторов 7)
┌─────┬───────┬───────┬───────┬───────┬───────┬───────┬───────┐
│ N │ 1 │ 2 │ 3 │ 4 │ 5 │ 6 │ 7 │
├─────┼───────┼───────┼───────┼───────┼───────┼───────┼───────┤
│ x4 │ 0.80 │ -0.05 │ 0.48 │ -0.17 │ -0.19 │ 0.08 │ -0.22 │
│ x5 │ -0.34 │ 0.70 │ 0.14 │ -0.60 │ -0.07 │ -0.13 │ 0.02 │
│ x6 │ -0.63 │ -0.49 │ -0.42 │ -0.27 │ 0.28 │ 0.05 │ -0.18 │
│ x7 │ -0.47 │ 0.58 │ -0.44 │ 0.19 │ -0.41 │ 0.15 │ -0.09 │
│ x8 │ -0.75 │ -0.08 │ 0.51 │ 0.29 │ -0.09 │ -0.25 │ -0.11 │
│ x9 │ 0.13 │ 0.80 │ 0.12 │ 0.23 │ 0.51 │ 0.05 │ -0.08 │
└─────┴───────┴───────┴───────┴───────┴───────┴───────┴───────┘
Рассмотрим три первые главные компоненты, так как их общий вклад в суммарную дисперсию составил 78%.
Связанным с первой главной компонентой является Х4, то есть трудоемкость единицы продукции.
Вторая главная компонента связана с Х9, Х5, Х7, Х6, то есть с удельным весом потерь от брака, с удельным весом рабочих в составе промышленно-производственного персонала, с коэффициентом сменности оборудования и с удельным весом покупных изделий.
Третья главная компонента связана с Х8 – премии и вознаграждения на одного работника в % к заработной плате.
┌───┬──────────┐
│ N │ Оценка │
│ │ общности │
├───┼──────────┤
│ 1 │ 1.00 │
│ 2 │ 1.00 │
│ 3 │ 1.00 │
│ 4 │ 1.00 │
│ 5 │ 1.00 │
│ 6 │ 1.00 │
│ 7 │ 1.00 │
└───┴──────────┘
Просмотр главных компонент
N
|
Фактор1
|
Фактор2
|
Фактор3
|
Фактор4
|
Фактор5
|
Фактор6
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
|
-0.72
0.28
-0.53
-1.39
-0.62
0.14
0.56
-0.98
0.41
-1.07
-0.39
0.04
-0.24
2.09
1.36
1.08
1.62
0.77
0.65
-0.04
0.07
1.47
1.45
-1.4
-1.61
-0.59
0.31
-0.13
-1.69
-0.89
|
0.13
1.56
1.29
0.96
0.72
1.08
-1.82
-0.48
-0.96
-0.45
-1.59
-2.07
-1.35
-0.93
1.32
0.33
-0.05
0.57
0.11
0.57
0.38
1.34
-0.89
0.49
0.99
0.55
0.003
0.21
-1.38
-0.65
|
0.33
-0.02
1.73
-1.57
-0.29
-0.77
1.71
1.57
0.05
-0.84
-0.24
-0.14
-0.60
0.31
-0.45
-0.34
-0.47
-1.67
1.35
0.94
0.73
1.34
-0.63
-0.56
1.97
-1.67
-1.04
-0.46
-0.17
-0.12
|
-0.80
0.12
1.68
0.99
2.76
-0.31
0.03
0.65
0.88
0.04
0.99
-0.40
1.47
0.37
1.55
-0.54
-0.81
-0.77
-1.38
-0.89
-0.55
-0.47
0.32
-1.035
-0.36
-1.29
0.59
-1.11
-0.70
-1.00
|
-0.61
-0.54
-0.53
-1.39
-0.79
2.18
-0.80
0.01
2.09
1.01
0.26
0.82
-0.17
-0.65
1.31
-0.78
-1.02
-1.64
0.11
-0.16
1.36
-0.18
-1.14
-0.23
-0.09
-0.08
1.06
1.73
-1.07
-0.06
|
-0,26
0,44
0,44
1,07
0,18
0,50
-0,43
0,10
0,39
0,14
0,48
0,58
-0,91
-0,86
0,44
0,35
-1,74
-0,15
1,25
0,41
0,06
0,02
-4,01
1,17
-0,52
1,30
0,52
-0,31
0,21
-0,84
|
Проведем регрессионный анализ на главные компоненты.
*** Протокол множественной линейной регрессии ***
Зависимая переменная Y - y2
Функция Y = +13.494-2.249*Фактор N1-0.414*Фактор N2+3.788*Фактор N3-1.061*Фак
тор N4+0.526*Фактор N5+0.530*Фактор N6
Оценки коэффициентов линейной регрессии
┌───┬──────────┬───────────┬───────────────┬───────────┬────────┬─────────┐
│ N │ Значение │ Дисперсия │ Средне- │ t - │ Нижняя │ Верхняя │
│ │ │ │ квадатическое │ значение │ оценка │ оценка │
│ │ │ │ отклонение │ │ │ │
├───┼──────────┼───────────┼───────────────┼───────────┼────────┼─────────┤
│ 1 │ 13.49 │ 0.48 │ 0.69 │ 19.57 │ 12.31 │ 14.68 │
│ 2 │ -2.25 │ 0.48 │ 0.69 │ -3.26 │ -3.43 │ -1.06 │
│ 3 │ -0.41 │ 0.48 │ 0.69 │ -0.60 │ -1.60 │ 0.77 │
│ 4 │ 3.79 │ 0.48 │ 0.69 │ 5.49 │ 2.60 │ 4.97 │
│ 5 │ -1.06 │ 0.48 │ 0.69 │ -1.54 │ -2.25 │ 0.12 │
│ 6 │ 0.53 │ 0.48 │ 0.69 │ 0.76 │ -0.66 │ 1.71 │
│ 7 │ 0.53 │ 0.48 │ 0.69 │ 0.77 │ -0.66 │ 1.72 │
└───┴──────────┴───────────┴───────────────┴───────────┴────────┴─────────┘
Кpитические значения t-pаспpеделения
пpи 23 степенях свободы
веpоятность t-значение
0.900 1.323
0.950 1.719
0.990 2.503
Сравнивая расчетные t-значения с tкр=1,323, с вероятностью 0,95 можно утверждать, что фактор1, фактор 4, фактор 2 и фактор 5 являются значимыми.
Оценки коэффициентов интерпретации линейной регрессии
╔════╤════════╤═════════╤═════════╗
║ N │Коэффиц.│Вета- │Дельта- ║
║ │эластичн│коэффиц. │коэффиц. ║
╠════╪════════╪═════════╪═════════╣
║1 │ +0.000│ -0.396│ +0.238║
║2 │ +0.000│ -0.073│ +0.008║
║3 │ +0.000│ +0.668│ +0.675║
║4 │ +0.000│ -0.187│ +0.053║
║5 │ +0.000│ +0.093│ +0.013║
║6 │ -0.000│ +0.093│ +0.013║
╚════╧════════╧═════════╧═════════╝
Таблица остатков
┌────┬──────────────┬───────────┬────────────┬───────────────┐
│ N │ Эмпирическое │ Расчетное │ Ошибка │ Ошибка │
│ │ значение │ значение │ абсолютная │ относительная │
├────┼──────────────┼───────────┼────────────┼───────────────┤
│ 1 │ 13.26 │ 16.53 │ -3.27 │ -0.25 │
│ 2 │ 10.16 │ 11.75 │ -1.59 │ -0.16 │
│ 3 │ 13.72 │ 18.26 │ -4.54 │ -0.33 │
│ 4 │ 12.85 │ 6.21 │ 6.64 │ 0.52 │
│ 5 │ 10.63 │ 8.74 │ 1.89 │ 0.18 │
│ 6 │ 9.12 │ 9.91 │ -0.79 │ -0.09 │
│ 7 │ 25.83 │ 21.27 │ 4.56 │ 0.18 │
│ 8 │ 23.39 │ 20.63 │ 2.76 │ 0.12 │
│ 9 │ 14.68 │ 12.94 │ 1.74 │ 0.12 │
│ 10 │ 10.05 │ 11.42 │ -1.37 │ -0.14 │
│ 11 │ 13.99 │ 12.77 │ 1.22 │ 0.09 │
│ 12 │ 9.68 │ 14.81 │ -5.13 │ -0.53 │
│ 13 │ 10.03 │ 10.21 │ -0.18 │ -0.02 │
│ 14 │ 9.13 │ 12.59 │ -3.46 │ -0.38 │
│ 15 │ 5.37 │ 7.27 │ -1.90 │ -0.35 │
│ 16 │ 9.86 │ 11.26 │ -1.40 │ -0.14 │
│ 17 │ 12.62 │ 10.70 │ 1.92 │ 0.15 │
│ 18 │ 5.02 │ 6.28 │ -1.26 │ -0.25 │
│ 19 │ 21.18 │ 20.44 │ 0.74 │ 0.04 │
│ 20 │ 25.17 │ 18.25 │ 6.92 │ 0.27 │
│ 21 │ 19.10 │ 17.12 │ 1.98 │ 0.10 │
│ 22 │ 21.00 │ 17.22 │ 3.78 │ 0.18 │
│ 23 │ 6.57 │ 9.51 │ -2.94 │ -0.45 │
│ 24 │ 14.19 │ 13.57 │ 0.62 │ 0.04 │
│ 25 │ 15.81 │ 23.35 │ -7.54 │ -0.48 │
│ 26 │ 5.23 │ 8.23 │ -3.00 │ -0.57 │
│ 27 │ 7.99 │ 8.16 │ -0.17 │ -0.02 │
│ 28 │ 17.50 │ 13.22 │ 4.28 │ 0.24 │
│ 29 │ 17.16 │ 16.39 │ 0.77 │ 0.04 │
│ 30 │ 14.54 │ 15.81 │ -1.27 │ -0.09 │
└────┴──────────────┴───────────┴────────────┴───────────────┘
Характеристики остатков
Среднее значение..................... -0.000
Оценка дисперсии..................... 10.9
Оценка приведенной дисперсии........ 14.3
Средний модуль остатков.............. 2.655
Относительная ошибка аппроксимации... 0.217
Критерий Дарбина-Уотсона............. 1.749
Коэффициент детерминации............. 0.660
F - значение ( n1 = 7, n2 = 23)... 61.1
Гипотеза о значимости уравнения
не отвергается с вероятностью 0.950
Факторы, включенные в уравнение регрессии, объясняют 66% вариации уровня производительности труда.
Сравнивая F-значение = 61,1 с Fкр = 2,53, можно сделать вывод, что уравнение регрессии на главные компоненты является значимым с вероятностью 0,95.
Сравним теперь два полученных уравнения регрессий: регрессии на исходные данные и регрессии на главные компоненты:
Функция Y = -0.990+28.691*x5-12.346*x7+9.610*x8
Функция Y = +13.494-2.249*Фактор N1-0.414*Фактор N2+3.788*Фактор N3-1.061*Фак
Анализируя эти два уравнения и помня, что первая главная компонента связана с Х4, можно сделать вывод, что уравнение регрессии на главные компоненты дает лучшую интерпретацию результатов. Следовательно, рентабельность зависит в основном от трудоемкость единицы продукции.
Заключение
В данной работе с помощью методов многомерного статистического анализа (корреляционного, регрессионного, компонентного и факторного анализов) проанализировано влияние нескольких факторов на производительность труда.
Проведенный анализ позволил выявить влияние на рентабельность таких факторов, как трудоемкость единицы продукции, удельный вес рабочих в составе промышленно-производственного персонала, удельный вес покупных изделий, коэффициент сменности оборудования, премии и вознаграждении на одного работника в % к заработной плате и удельный вес потерь от брака.
В результате сравнения двух полученных уравнений мы сделали вывод, что уравнение регрессии на главные компоненты лучше интерпретирует результаты анализа, чем уравнение регрессии на исходные данные.
Список использованной литературы
1. Исследование зависимостей и снижение размерностей с использованием ППП «Олимп», Мхитарян В.С., Дубров А.М., Трошин Л.И., Дуброва Т.А., Корнилов И.А. - М.: МЭСИ, 2000.
2. Многомерные статистические методы, Дубров А.М.. Мхитарян В.С., Трошин Л.И. - М.: Финансы и статистика, 2000.
|