|
Контрольная работа: Парная регрессия
Получим линейное уравнение: . Выполнив
его потенцирование, получим:
Для расчета
теоретических значений y подставим в уравнение значения
x.
·
Рассчитаем параметры уравнений равносторонней гиперболы парной
регрессии. Для оценки параметров приведем модель равносторонней гиперболы к линейному виду, заменив , тогда
Для расчетов используем данные табл. 7:
№ региона |
X=1/z |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
1 |
0,357 |
28,000 |
10,000 |
0,128 |
784,000 |
26,715 |
2 |
0,417 |
21,300 |
8,875 |
0,174 |
453,690 |
23,259 |
3 |
0,476 |
21,000 |
10,000 |
0,227 |
441,000 |
19,804 |
4 |
0,385 |
23,300 |
8,962 |
0,148 |
542,890 |
25,120 |
5 |
0,588 |
15,800 |
9,294 |
0,346 |
249,640 |
13,298 |
6 |
0,400 |
21,900 |
8,760 |
0,160 |
479,610 |
24,227 |
7 |
0,417 |
20,000 |
8,333 |
0,174 |
400,000 |
23,259 |
8 |
0,385 |
22,000 |
8,462 |
0,148 |
484,000 |
25,120 |
9 |
0,357 |
23,900 |
8,536 |
0,128 |
571,210 |
26,715 |
10 |
0,385 |
26,000 |
10,000 |
0,148 |
676,000 |
25,120 |
11 |
0,385 |
24,600 |
9,462 |
0,148 |
605,160 |
25,120 |
12 |
0,400 |
21,000 |
8,400 |
0,160 |
441,000 |
24,227 |
13 |
0,345 |
27,000 |
9,310 |
0,119 |
729,000 |
27,430 |
14 |
0,385 |
21,000 |
8,077 |
0,148 |
441,000 |
25,120 |
15 |
0,455 |
24,000 |
10,909 |
0,207 |
576,000 |
21,060 |
16 |
0,385 |
34,000 |
13,077 |
0,148 |
1156,000 |
25,120 |
17 |
0,303 |
31,900 |
9,667 |
0,092 |
1017,610 |
29,857 |
19 |
0,256 |
33,000 |
8,462 |
0,066 |
1089,000 |
32,564 |
20 |
0,217 |
35,400 |
7,696 |
0,047 |
1253,160 |
34,829 |
21 |
0,270 |
34,000 |
9,189 |
0,073 |
1156,000 |
31,759 |
22 |
0,294 |
31,000 |
9,118 |
0,087 |
961,000 |
30,374 |
Итого |
7,860 |
540,100 |
194,587 |
3,073 |
14506,970 |
540,100 |
сред знач |
0,374 |
25,719 |
9,266 |
0,146 |
1318,815 |
|
стан отклон |
0,079 |
25,639 |
|
|
|
|
Рассчитаем a и b:
Получим линейное уравнение: . Получим
уравнение регрессии: .
3. Оценка
тесноты связи с помощью показателей корреляции и детерминации:
·
Линейная модель. Тесноту линейной связи оценит коэффициент
корреляции. Был получен следующий коэффициент корреляции rxy=b=7,122*, что говорит о прямой сильной связи фактора
и результата. Коэффициент детерминации r²xy=(0,845)²=0,715. Это
означает, что 71,5% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Степенная модель. Тесноту нелинейной связи оценит индекс
корреляции. Был получен следующий индекс корреляции =, что говорит о очень сильной тесной связи, но немного больше чем
в линейной модели. Коэффициент детерминации r²xy=0,7175. Это означает, что 71,75%
вариации результативного признака (розничная
продажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в
месяц.
·
Экспоненциальная модель. Был получен следующий индекс корреляции ρxy=0,8124, что говорит о том,
что связь прямая и очень сильная, но немного слабее, чем в линейной и степенной
моделях. Коэффициент детерминации r²xy=0,66. Это означает, что 66% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Полулогарифмическая модель. Был получен следующий индекс
корреляции ρxy=0,8578, что говорит о том, что связь прямая и очень сильная, но
немного больше чем в предыдущих моделях. Коэффициент детерминации r²xy=0,7358. Это означает, что 73,58%
вариации результативного признака (розничная
продажа телевизоров, у) объясняется вариацией фактора х – среднедушевой денежный доход в
месяц.
·
Гиперболическая модель. Был получен следующий индекс корреляции ρxy=0,8448 и коэффициент
корреляции rxy=-0,1784 что говорит о том, что связь обратная очень сильная.
Коэффициент детерминации r²xy=0,7358. Это означает, что 73,5% вариации результативного признака
(розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
·
Обратная модель. Был получен следующий индекс корреляции ρxy=0,8114 и коэффициент
корреляции rxy=-0,8120, что говорит о том, что связь обратная очень сильная.
Коэффициент детерминации r²xy=0,6584. Это означает, что 65,84% вариации результативного
признака (розничная продажа телевизоров, у) объясняется вариацией
фактора х – среднедушевой денежный доход в месяц.
Вывод: по полулогарифмическому
уравнению получена наибольшая оценка тесноты связи: ρxy=0,8578 (по сравнению с
линейной, степенной, экспоненциальной,
гиперболической, обратной регрессиями).
4. С
помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку
силы связи фактора с результатом.
Рассчитаем
коэффициент эластичности для линейной модели:
·
Для уравнения прямой: y = 5,777+7,122∙x
·
Для уравнения степенной модели :
·
Для уравнения экспоненциальной модели:
Для
уравнения полулогарифмической модели :
·
Для уравнения обратной
гиперболической модели :
·
Для уравнения равносторонней
гиперболической модели :
Сравнивая значения , характеризуем оценку силы связи фактора с
результатом:
·
·
·
·
·
·
Известно, что коэффициент эластичности показывает связь между
фактором и результатом, т.е. на сколько% изменится результат y от своей средней величины
при изменении фактора х на 1% от своего среднего значения. В данном
примере получилось, что самая большая сила связи между фактором и результатом в полулогарифмической модели, слабая сила связи в обратной
гиперболической модели.
5. Оценка
качества уравнений с помощью средней ошибки аппроксимации.
Подставляя в уравнение регрессии фактические значения х, определим
теоретические (расчетные) значения . Найдем величину
средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на:
·
Линейная регрессия. = *100%= 8,5%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Степенная регрессия. =*100%= 8,2%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Экспоненциальная регрессия. =*100%= 9%, что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Полулогарифмическая регрессия. =*100%= 7,9 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Гиперболическая регрессия. =*100%= 9,3 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
·
Обратная регрессия. =*100%= 9,9 3 что говорит о повышенной ошибке аппроксимации, но в
допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
6. Рассчитаем F-критерий:
·
Линейная регрессия. = *19= 47,579
где =4,38<
·
Степенная регрессия. =*19= 48,257
где =4,38<
·
Экспоненциальная регрессия. =*19= 36,878
где =4,38<
·
Полулогарифмическая регрессия. =*19= 52,9232
где =4,38<
·
Гиперболическая регрессия. =*19= 47,357
где =4,38<
·
Обратная регрессия. =*19= 36,627
где =4,38<
Для всех регрессий =4,38< , из чего
следует, что уравнения регрессии статистически значимы.
Вывод: остается
на допустимом уровне для всех уравнений регрессий.
|
А |
R^2 |
Fфакт |
Линейная модель |
8,5 |
0,714 |
47,500 |
Степенная модель |
8,2 |
0,718 |
48,250 |
Полулогарифмическая модель |
7,9 |
0,736 |
52,920 |
Экспоненциальная модель |
9,0 |
0,660 |
36,870 |
Равносторонняя гипербола |
9,3 |
0,714 |
47,350 |
Обратная гипербола |
9,9 |
0,453 |
15,700 |
Все уравнения регрессии достаточно хорошо описывают исходные
данные. Некоторое предпочтение можно отдать полулогарифмической функции, для
которой значение R^2 наибольшее, а ошибка аппроксимации – наименьшая
7. Рассчитаем прогнозное значение результата по линейному
уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его
среднего уровня. Определим доверительный интервал прогноза для уровня
значимости α=0,05:
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения .
5,777+7,122*2,996=27,114
где = =2,8*1,07=2,996
Средняя стандартная ошибка прогноза :
==3,12
где = =0,697886
Предельная ошибка прогноза:
Доверительный интервал прогноза
где
=27,116,53;
27,11–6,53 = 20,58
27,11+6,53 = 33,64
Выполненный прогноз среднедушевых
денежных доходов в месяц, x оказался надежным (р = 1 – α
= 1 – 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ
доверительного интервала составляет 2,09 раза:
= = =1,63
|