Курсовая работа: Расчет и анализ статистических показателей
Итак, среднее квадратическое
отклонение по несгруппированным данным для численности рабочих равно 20; по сгруппированному
признаку - 19.
г) Для оценки вариации и ее
значимости пользуются также коэффициентами вариации, которые дают относительную
оценку вариации и позволяет сравнивать степень вариации разных признаков. Различают:
коэффициент осцилляции;
относительное линейное
отклонение;
коэффициент вариации.
Коэффициент осцилляции
показывает соотношение размаха вариации и средней арифметической и
рассчитывается по формуле:
где -
коэффициент осцилляции;
- размах вариации;
- простая средняя арифметическая.
Рассчитаем коэффициенты
осцилляции:
для объема продаж
для численности работников
Относительное линейное
отклонение показывает отношение среднего линейного отклонения к средней
арифметической:
где -
относительное линейное отклонение;
- среднее линейное отклонение;
- простая средняя арифметическая.
Рассчитаем относительное
линейное отклонение:
для объема продаж
для численности работников
Коэффициент вариации, показывает
соотношение среднего квадратического отклонения и средней арифметической:
где V - коэффициент вариации; -
среднее квадратическое отклонение; - средняя
арифметическая.
Рассчитаем коэффициент вариации
по сгруппированным данным:
для объема продаж:
,
для численности работников:
Рассчитаем коэффициент вариации
по несгруппированным данным:
для объема продаж
для численности работников:
Рассматриваемый коэффициент
вариации по объему продаж составляет 2,5%, следовательно рассматриваемая
совокупность является однородной
а) дисперсии: общую,
межгрупповую и среднюю из внутригрупповых;
б) проверить правило сложения
дисперсий.
Квадрат среднего квадратического
отклонения дает величину дисперсии. Общую дисперсию, характеризующую вариацию
признака под влиянием всех факторов, можно получить на основе ее составляющих -
межгрупповой и внутригрупповой дисперсий.
Общая дисперсия рассчитывается
по формуле
Межгрупповая дисперсия отражает
систематическую вариацию, т.е. те различия в величине изучаемого признака,
которые возникают под влиянием фактора, положенного а основу группировки и
рассчитывается по формуле:
где -
межгрупповая дисперсия;
-
средняя арифметическая в i-й группе;
-
простая средняя арифметическая;
-
частота i-й группы.
Внутригрупповая дисперсия:
где -
внутригрупповая дисперсия;
- индивидуальное значение
единицы совокупности из i-й группы;
-
простая средняя арифметическая i-й группы;
- частота i-й группы.
Рассчитаем общую дисперсию для
объема продаж
Рассчитаем межгрупповую
дисперсию для объема продаж, для этого найдем среднюю арифметическую (простую)
в каждой группе известным методом, результаты поместим в Таблице 6.1.
Таблица 6.1
Средняя арифметическая в каждой
группе для объема продаж
Объем продаж |
Количество |
Средняя арифметическая |
А |
1 |
2 |
5100-5210
5210-5320
|
2
6
|
5150
5276
|
5320-5430 |
6 |
5367 |
5430-5540 |
8 |
5452 |
5540-5650 |
5 |
5602 |
Итого: |
27 |
|
Межгрупповая дисперсия равна 16619.
Для того чтобы рассчитать
дисперсию среднюю из внутригрупповых, необходимо найти дисперсию в каждой
группе.
Теперь, исходя из приведенных
расчетов, вычислим дисперсию среднюю из внутригрупповых.
Средняя из внутригрупповых
дисперсия равна 989. Рассчитаем дисперсии для второго признака - численности
работников. Общая дисперсия:
Общая дисперсия равна 406.
Рассчитаем межгрупповую
дисперсию для численности работников, для этого найдем среднюю арифметическую (простую)
в каждой группе, результаты поместим в Таблице 6.2.
Таблица 6.2
Средняя арифметическая в каждой
группе для численности работников
Коэффициент сменности |
Количество |
Средняя арифметическая |
А |
1 |
2 |
420-429
429-438
|
3
5
|
423
435
|
438-447 |
6 |
444 |
447-456 |
5 |
453 |
456-465 |
5 |
461 |
465-474 |
3 |
471 |
Итого: |
27 |
|
По данным представленной таблицы
рассчитаем межгрупповую дисперсию.
Межгрупповая дисперсия равна 403.
Используя рассчитанные данные,
найдем дисперсию среднюю из внутригрупповых.
Средняя из внутригрупповых
дисперсия для численности работников равна 3,34.
б) Проверим правило сложения
дисперсий.
Между рассмотренными видами
дисперсий существует определенное соотношение: общая дисперсия равна сумме
средней из внутригрупповых дисперсий и межгрупповой, т.е.
где -
общая дисперсия;
-
межгрупповая дисперсия;
-
средняя из внутригрупповых дисперсия.
Проверим правило сложения
дисперсий для объема продаж
=16619
=989
17608= 16619+989
Видно, что средняя из
внутригрупповых теоретическая совпадает с расчетной, а именно:
Проверим правило сложения
дисперсий для численности рабочих.
=403
=3,34
406=3,34+403
Как видно, средняя из
внутригрупповых расчетная оказалась равна теоретической, т.е.
Это значит, что в нашем случае
правило сложения дисперсий верно.
а) эмпирическую;
б) теоретическую (функция
нормального распределения - Приложение Б).
а) Эмпирическая кривая строится
по результатам группировки. Теоретическая линия строится по теоретическим
частотам. Теоретические частоты определяются по формуле:
где -
теоретические частоты для определенной группы;
-
величина интервала;
-
сумма эмпирических частот ряда;
-
среднее квадратическое отклонение для сгруппированных данных;
-
математическая функция, определяемая по специальным таблицам в соответствии с
рассчитанным значением ;
-
центральный вариант i-го интервала;
-
средняя арифметическая взвешенная;
- нормированное отклонение.
а) Рассчитаем теоретические
частоты для объема продаж и результаты поместим в Таблице 7.1.
Остальные показатели
рассчитываются аналогично.
Таблица 7.1
Теоретические частоты для объема
продаж
Объем продаж |
Количество |
t |
ф (t) |
Теоретические частоты |
А |
1 |
2 |
3 |
4 |
5100-5210
5210-5320
|
2
6
|
1,87
1,03
|
0,0693
0,2347
|
2
5
|
5320-5430 |
6 |
0,18 |
0,3925 |
9 |
5430-5540 |
8 |
0,66 |
0,3209 |
7 |
5540-5650 |
5 |
1,51 |
0,1276 |
4 |
Итого: |
27 |
|
|
27 |
По данным таблицы построим
теоретическую и эмпирическую кривые распределения.
Рисунок 7.1 Кривые распределения
объема продаж
Условные обозначения:
х - объем распределения;
f - частота;
1 - эмпирическая линия;
2 - теоретическая линия.
Рассчитаем теоретические частоты
для численности работников и результаты поместим в Таблице 7.2.
Таблица 7.2
Теоретические частоты для численности
работников
Коэффициент сменности |
Количество |
t |
ф (t) |
Теоретические частоты |
А |
1 |
2 |
3 |
4 |
420-429 |
3 |
0,53 |
0,3467 |
5 |
429-438 |
5 |
0,05 |
0,3984 |
6 |
438-447 |
6 |
0,42 |
0,3653 |
6 |
447-456 |
5 |
0,89 |
0,2685 |
5 |
456-465 |
5 |
1,36 |
0,1582 |
3 |
465-474 |
3 |
1,84 |
0,0734 |
2 |
Итого: |
27 |
|
|
27 |
По данным таблицы построим
теоретическую и эмпирическую кривые распределения.
Рисунок 7.2 Кривые распределения
численности рабочих
Условные обозначения:
х - объем распределения;
f - частота;
1 - эмпирическая линия;
2 - теоретическая линия.
а) рассчитать асимметрию;
б) рассчитать эксцесс;
в) определить существенность
асимметрии и эксцесса;
г) оценить соответствие эмпирического
ряда распределения теоретическому по критериям Пирсона, Колмогорова (Приложения
В, Г).
а) Коэффициент асимметрии
определяется как отношение разницы между средней и модой к среднему
квадратическому отклонению (показатель Пирсона):
где -
коэффициент асимметрии;
- средняя арифметическая взвешенная;
- мода;
- среднее квадратическое отклонение для сгруппированных данных.
Рассчитаем асимметрию для объема
продаж.
=0,25
Рассчитаем асимметрию для численности
работников.
=0,63
Существенность асимметрии:
Рассчитаем этот показатель для объема
продаж и сравним его с коэффициентом асимметрии.
Асимметрия равна 1,7, >0, это говорит о том,
что асимметрия правосторонняя (первый признак).
Теперь рассчитаем данный
показатель для численности работников и сравним его с коэффициентом асимметрии.
,
Имеет место асимметрия, равная
0, т. е ряд абсолютно симметричен.
б) Для оценки крутизны данного
распределения в сравнении с нормальным вычисляется эксцесс распределения. Эксцесс
рассчитывается по формуле:
где -
эксцесс;
-
центральный момент четвертого порядка;
- среднее квадратическое отклонение для сгруппированных данных.
Центральный момент четвертого
порядка:
где -
центральный момент четвертого порядка;
-
центральный вариант i-го интервала;
- средняя арифметическая взвешенная;
-
частота i-й группы.
Рассчитаем центральный момент
четвертого порядка и эксцесс для объема продаж.
=
- 0,82
Эксцесс отрицателен, следовательно,
эмпирическая кривая распределения низковершинна по сравнению с нормальным
распределением.
Рассчитаем центральный момент
четвертого порядка и эксцесс для численности работников.
=
- 1,07
Эксцесс отрицателен, значит
крутизна распределения меньше нормального.
в) Определим существенность
эксцесса. Распределение можно считать нормальным, если показатель эксцесса не
превышает своего двукратного среднего квадратического отклонения, которое
вычисляется по формуле:
Определим существенность
эксцесса для объема продаж.
Определим существенность
эксцесса для стажа по специальности.
г) Критерий Пирсона
рассчитывается по формуле:
где -
критерий согласия Пирсона;
-
эмпирические частоты;
-
теоретические частоты.
Критерий Романовского:
где -
критерий Романовского;
- критерий Пирсона;
- количество групп.
Критерий Колмогорова:
где -
критерий Колмогорова;
-
максимальная разность между накопленными теоретическими и эмпирическими
частотами;
-
численность совокупности.
Рассчитаем данные критерии для объема
продаж.
Критерий Пирсона.
При вероятности Р = 0,95 и числе
степеней свободы К = 2 расчетное значение меньше теоретического, следовательно
гипотеза о близости эмпирического распределения к нормальному не опровергается.
Критерий Романовского
Значение критерия Романовского
меньше 3, значит, распределение является нормальным. Расхождения между
эмпирическими и теоретическими частотами можно считать случайными.
Критерий Колмогорова.
Р (λ) =1
Таким образом, с вероятностью,
равной 1, можно утверждать, что отклонения эмпирических частот от теоретических
случайны.
Рассчитаем данные критерии для численности
работников
Критерий Пирсона.
Расчетное значение критерия
Пирсона меньше теоретического значит, распределение соответствует нормальному.
Критерий Романовского.
Значение критерия Романовского меньше 3, значит, распределение является
нормальным. Расхождения между эмпирическими и теоретическими частотами можно
считать случайными. Критерий Колмогорова.
Р (λ) =1
Таким образом, с вероятностью,
равной 1, можно утверждать, что отклонения эмпирических частот от теоретических
случайны, следовательно, можно считать, что в основе эмпирического
распределения совокупности по уровню предприятий по коэффициенту сменности лежит
закон нормального распределения.
При построении аналитической
таблицы независимый (факторный) признак расположить в строках таблицы, а
зависимый перегруппировать во взаимосвязи с факторным. Провести
корреляционно-регрессионный анализ:
а) построить поле корреляции;
б) рассчитать коэффициенты
регрессии, эластичности. Сделать оценку уравнения регрессии, рассчитав среднюю
квадратическую ошибку уравнения регрессии. Оценить значимость линии регрессии,
выражающей связь между двумя признаками, сравнив среднюю квадратическую ошибку
уравнения регрессии со средним квадратическим отклонением, рассчитанным по
зависимому признаку;
в) рассчитать линейный
коэффициент корреляции;
г) эмпирическое корреляционное
отношение;
д) теоретическое корреляционное
отношение;
е) коэффициент корреляции рангов
Спирмэна;
ж) коэффициент ранговой
корреляции Кендалла;
з) коэффициент Фехнера;
и) произвести оценку достоверности
коэффициента корреляции по критерию Фишера (Приложение Д).
Для исследования зависимости
между явлениями используют аналитическую группировку. При их построении можно
установить взаимосвязь между двумя признаками и более. При этом факторными
будут называться признаки, под воздействием которых изменяются результативные
признаки. Представим аналитическую группировку в таблице 9.1.
Таблица 9.1 Аналитическая
группировка
Объем продаж |
Численность работников |
|
Итого: |
|
420-429 |
429-438 |
438-447 |
447-456 |
456-465 |
465-473 |
|
5100-5210 |
2 |
|
|
|
|
|
2 |
5210-5320 |
1 |
5 |
|
|
|
|
6 |
5320-5430 |
|
|
2 |
2 |
2 |
|
6 |
5430-5560 |
|
|
2 |
2 |
2 |
2 |
8 |
5560-5670 |
|
|
2 |
1 |
1 |
1 |
5 |
Итого: |
3 |
5 |
6 |
5 |
5 |
3 |
27 |
а) Корреляционную зависимость
для наглядности можно изобразить графически. Для этого, имея n
взаимосвязанных пар значений x и y,
пользуясь прямоугольной системой координат, каждую такую пару изображают в виде
точки на плоскости с координатами x и y.
А затем на фоне "корреляционного поля" строится средняя линия. Представим
поле корреляции на рисунке 9.1.
Рисунок 9.1 Поле корреляции
Условные обозначения:
х - стаж по специальности;
у - средняя зарплата;
1 - линия тренда.
б) Уравнение линии, выбранной
для выравнивания y, называется уравнением регрессии. Параметры
уравнения регрессии а и а рассчитываются из системы уравнений, составленной по
методу наименьших квадратов: Суть метода в том, что линия пройдет в
максимальной близости от эмпирических точек.
где -
зависимый признак; - коэффициенты
уравнения прямой; - независимый
признак; - число выборки.
Составим уравнение регрессии:
y=5207+13,7х
Средняя линия представлена на
рисунке 9.1.
Рассчитаем коэффициент
эластичности. Он показывает, на сколько процентов изменится в среднем
результативный признак y при изменении факторного
признака x на 1%. Этот коэффициент рассчитываться по
формуле:
где -
коэффициент эластичности;
-
коэффициент при в уравнении
прямой;
- среднее значение факторного признака;
- среднее значение зависимого признака.
Таким образом, при изменении численности
рабочих на 1%, объем продаж изменится на 1,1%
в) Линейный коэффициент
корреляции. Он строится на основе отклонения индивидуальных значений х и у от
соответствующей средней величины и рассчитывается по формуле:
где -
линейный коэффициент корреляции;
-
среднее произведение факторного признака на зависимый;
-
произведение факторного признака на зависимый;
-
простая средняя арифметическая факторного признака;
-
простая средняя арифметическая зависимого признака;
- среднее
квадратическое отклонение по зависимому признаку;
- среднее квадратическое отклонение по факторному признаку.
Найдем среднюю из произведений
ху:
Теперь можно найти
непосредственно линейный коэффициент корреляции:
Этот коэффициент свидетельствует
о том, что между известными признаками существует прямая связь, т.е. при
увеличении числености аботников объем продаж увеличивается.
г) Эмпирическое корреляционное
отношение.
С его помощью можно измерить
тесноту связи. Этот коэффициент рассчитывается по формуле:
Таким образом, в нашем случае
эмпирическое корреляционное отношение равно:
Полученное значение
характеризует тесноту связи близкую к максимальной, значит можно сделать вывод
о наличии существенной связи между уровнем объема продаж и численности работников.
д) Рассчитаем теоретическое
корреляционное отношение:
где -
теоретическое корреляционное отношение; -
общая дисперсия зависимого признака по несгруппированным данным;
-
остаточная дисперсия;
-
теоретическое значение;
-
простая средняя арифметическая эмпирического ряда;
-
численность совокупности.
Для этого сделаем расчет
следующих параметров (Таблица 9.2):
Таблица 9.2
Расчет
среднеквадратичного отклонения теоретических значений от средней эмпирического
ряда
Численность рабочих |
Теоретические значения |
-
|
(-) 2
|
424 |
422 |
433 |
446 |
455 |
432 |
443 |
434 |
437 |
438 |
444 |
423 |
442 |
444 |
443 |
455 |
452 |
457 |
455 |
450 |
462 |
462 |
464 |
460 |
471 |
472 |
470 |
|
5220 |
5120 |
5180 |
5225 |
5450 |
5465 |
5326 |
5350 |
5390 |
5375 |
5271 |
5312 |
5320 |
5348 |
5410 |
5440 |
5456 |
5440 |
5470 |
5460 |
5435 |
5310 |
5560 |
5596 |
5553 |
5650 |
5650 |
|
-179
279
219
174
51
66
73
49
9
24
128
87
79
51
11
41
57
41
71
61
36
89
161
197
154
251
251
|
32041
77841
47961
30276
2601
4356
5329
2401
81
576
16384
7569
6241
2601
121
1681
3249
1681
5041
3721
1296
7921
25921
38809
23716
63001
63001
|
Итого: |
|
|
475417 |
Найдем остаточную дисперсию:
Рассчитаем теоретическое
корреляционное отношение:
Итак, теоретическое
корреляционное отношение равно 1, следовательно, между коррелируемыми
величинами существует большая зависимость.
е) Коэффициент корреляции
Спирмэна. Для расчета этого коэффициента необходимо привести таблицу корреляции
рангов (таблица 9.3).
Таблица 9.3 Корреляция рангов
х |
Rx |
Rxy |
y |
Ry |
Rxy |
d |
знаки |
|
|
|
|
|
|
|
х |
у |
424 |
3 |
3 |
5220 |
3 |
3 |
0 |
- |
- |
422 |
1 |
1 |
5120 |
1 |
1 |
0 |
+ |
+ |
433 |
5 |
5 |
5180 |
2 |
2 |
3 |
- |
- |
446 |
14 |
14 |
5225 |
4 |
4 |
10 |
+ |
+ |
455 |
17 |
17 |
5450 |
18 |
18 |
-1 |
- |
- |
432 |
4 |
4 |
5465 |
21 |
21 |
-17 |
+ |
+ |
443 |
10 |
10 |
5326 |
9 |
9 |
1 |
- |
- |
434 |
6 |
6 |
5350 |
11 |
11 |
-5 |
+ |
+ |
437 |
7 |
7 |
5390 |
13 |
13 |
-5 |
- |
- |
438 |
8 |
8 |
5375 |
12 |
12 |
-4 |
+ |
+ |
444 |
12 |
12 |
5271 |
5 |
5 |
7 |
- |
- |
423 |
2 |
2 |
5312 |
7 |
7 |
-5 |
+ |
+ |
442 |
9 |
9 |
5320 |
8 |
8 |
1 |
- |
- |
444 |
13 |
13 |
5348 |
10 |
10 |
3 |
+ |
+ |
443 |
11 |
11 |
5410 |
14 |
14 |
-3 |
- |
- |
455 |
18 |
18 |
5440 |
16 |
16 |
2 |
+ |
+ |
452 |
16 |
16 |
5456 |
19 |
19 |
-3 |
- |
- |
457 |
20 |
20 |
5440 |
17 |
17 |
3 |
+ |
+ |
455 |
19 |
19 |
5470 |
22 |
22 |
-3 |
- |
- |
450 |
15 |
15 |
5460 |
20 |
20 |
-5 |
+ |
+ |
462 |
22 |
22 |
5435 |
15 |
15 |
7 |
- |
- |
462 |
23 |
23 |
5310 |
6 |
6 |
17 |
+ |
+ |
464 |
24 |
24 |
5560 |
24 |
24 |
0 |
- |
- |
460 |
21 |
21 |
5596 |
25 |
25 |
-4 |
+ |
+ |
471 |
26 |
26 |
5553 |
23 |
23 |
3 |
+ |
+ |
472 |
27 |
27 |
5650 |
26 |
26 |
1 |
+ |
+ |
470 |
25 |
25 |
5650 |
27 |
27 |
-2 |
|
|
Ранг - это порядковый номер,
присеваемый каждому индивидуальному значению х и у (отдельно) в ранжированном
ряду. Оба признака необходимо ранжировать в одном и том же порядке: от меньших
значений к большим и наоборот. Если встречается несколько одинаковых значений
признака, то каждому из них присваивается ранг, равный частному от деления
суммы рангов (мест в ряду), приходящихся на эти значения, на число равных
значений.
Страницы: 1, 2, 3
|