Рефераты

Курсовая работа: Расчет и анализ статистических показателей

Итак, среднее квадратическое отклонение по несгруппированным данным для численности рабочих равно 20; по сгруппированному признаку - 19.

г) Для оценки вариации и ее значимости пользуются также коэффициентами вариации, которые дают относительную оценку вариации и позволяет сравнивать степень вариации разных признаков. Различают:

коэффициент осцилляции;

относительное линейное отклонение;

коэффициент вариации.

Коэффициент осцилляции показывает соотношение размаха вариации и средней арифметической и рассчитывается по формуле:

где  - коэффициент осцилляции;

* - размах вариации;

* - простая средняя арифметическая.

Рассчитаем коэффициенты осцилляции:

для объема продаж

для численности работников

Относительное линейное отклонение показывает отношение среднего линейного отклонения к средней арифметической:

где  - относительное линейное отклонение;

* - среднее линейное отклонение;

* - простая средняя арифметическая.

Рассчитаем относительное линейное отклонение:

для объема продаж


для численности работников

Коэффициент вариации, показывает соотношение среднего квадратического отклонения и средней арифметической:

где V - коэффициент вариации;  - среднее квадратическое отклонение;  - средняя арифметическая.

Рассчитаем коэффициент вариации по сгруппированным данным:

для объема продаж:

,

для численности работников:

Рассчитаем коэффициент вариации по несгруппированным данным:

для объема продаж

для численности работников:

Рассматриваемый коэффициент вариации по объему продаж составляет 2,5%, следовательно рассматриваемая совокупность является однородной

1.6 Рассчитать дисперсии и произвести дисперсионный анализ

а) дисперсии: общую, межгрупповую и среднюю из внутригрупповых;

б) проверить правило сложения дисперсий.

Квадрат среднего квадратического отклонения дает величину дисперсии. Общую дисперсию, характеризующую вариацию признака под влиянием всех факторов, можно получить на основе ее составляющих - межгрупповой и внутригрупповой дисперсий.

Общая дисперсия рассчитывается по формуле

Межгрупповая дисперсия отражает систематическую вариацию, т.е. те различия в величине изучаемого признака, которые возникают под влиянием фактора, положенного а основу группировки и рассчитывается по формуле:

где  - межгрупповая дисперсия;

 - средняя арифметическая в i-й группе;

 - простая средняя арифметическая;

 - частота i-й группы.

Внутригрупповая дисперсия:


где  - внутригрупповая дисперсия;

 - индивидуальное значение единицы совокупности из i-й группы;

 - простая средняя арифметическая i-й группы;

* - частота i-й группы.

Рассчитаем общую дисперсию для объема продаж

Рассчитаем межгрупповую дисперсию для объема продаж, для этого найдем среднюю арифметическую (простую) в каждой группе известным методом, результаты поместим в Таблице 6.1.

Таблица 6.1

Средняя арифметическая в каждой группе для объема продаж

Объем продаж Количество Средняя арифметическая
А 1 2

 5100-5210

5210-5320

2

6

5150

5276

5320-5430 6 5367
5430-5540 8 5452
5540-5650 5 5602
Итого: 27

Межгрупповая дисперсия равна 16619.

Для того чтобы рассчитать дисперсию среднюю из внутригрупповых, необходимо найти дисперсию в каждой группе.

Теперь, исходя из приведенных расчетов, вычислим дисперсию среднюю из внутригрупповых.

Средняя из внутригрупповых дисперсия равна 989. Рассчитаем дисперсии для второго признака - численности работников. Общая дисперсия:

Общая дисперсия равна 406.

Рассчитаем межгрупповую дисперсию для численности работников, для этого найдем среднюю арифметическую (простую) в каждой группе, результаты поместим в Таблице 6.2.

Таблица 6.2

Средняя арифметическая в каждой группе для численности работников

Коэффициент сменности Количество Средняя арифметическая
А 1 2

420-429

429-438

3

5

423

435

438-447 6 444
447-456 5 453
456-465 5 461
465-474 3 471
Итого: 27

По данным представленной таблицы рассчитаем межгрупповую дисперсию.

Межгрупповая дисперсия равна 403.

Используя рассчитанные данные, найдем дисперсию среднюю из внутригрупповых.

Средняя из внутригрупповых дисперсия для численности работников равна 3,34.

б) Проверим правило сложения дисперсий.

Между рассмотренными видами дисперсий существует определенное соотношение: общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой, т.е.

где  - общая дисперсия;

 - межгрупповая дисперсия;

 - средняя из внутригрупповых дисперсия.

Проверим правило сложения дисперсий для объема продаж

=16619

=989

17608= 16619+989

Видно, что средняя из внутригрупповых теоретическая совпадает с расчетной, а именно:

Проверим правило сложения дисперсий для численности рабочих.

=403

=3,34

406=3,34+403

Как видно, средняя из внутригрупповых расчетная оказалась равна теоретической, т.е.

Это значит, что в нашем случае правило сложения дисперсий верно.

1.7 Построить кривые распределения

а) эмпирическую;

б) теоретическую (функция нормального распределения - Приложение Б).

а) Эмпирическая кривая строится по результатам группировки. Теоретическая линия строится по теоретическим частотам. Теоретические частоты определяются по формуле:

где  - теоретические частоты для определенной группы;

 - величина интервала;

 - сумма эмпирических частот ряда;

 - среднее квадратическое отклонение для сгруппированных данных;

 - математическая функция, определяемая по специальным таблицам в соответствии с рассчитанным значением ;

 - центральный вариант i-го интервала;

 - средняя арифметическая взвешенная;

* - нормированное отклонение.

а) Рассчитаем теоретические частоты для объема продаж и результаты поместим в Таблице 7.1.

Остальные показатели рассчитываются аналогично.

Таблица 7.1

Теоретические частоты для объема продаж

Объем продаж Количество t ф (t) Теоретические частоты
А 1 2 3 4

5100-5210

5210-5320

2

6

1,87

1,03

0,0693

0,2347

2

5

5320-5430 6 0,18 0,3925 9
5430-5540 8 0,66 0,3209 7
5540-5650 5 1,51 0,1276 4
Итого: 27 27

По данным таблицы построим теоретическую и эмпирическую кривые распределения.


Рисунок 7.1 Кривые распределения объема продаж

Условные обозначения:

х - объем распределения;

f - частота;

1 - эмпирическая линия;

2 - теоретическая линия.

Рассчитаем теоретические частоты для численности работников и результаты поместим в Таблице 7.2.

Таблица 7.2

Теоретические частоты для численности работников

Коэффициент сменности Количество t ф (t) Теоретические частоты
А 1 2 3 4
420-429 3 0,53 0,3467 5
429-438 5 0,05 0,3984 6
438-447 6 0,42 0,3653 6
447-456 5 0,89 0,2685 5
456-465 5 1,36 0,1582 3
465-474 3 1,84 0,0734 2
Итого: 27 27

По данным таблицы построим теоретическую и эмпирическую кривые распределения.

Рисунок 7.2 Кривые распределения численности рабочих

Условные обозначения:

х - объем распределения;

f - частота;

1 - эмпирическая линия;

2 - теоретическая линия.

1.8 Произвести анализ ряда распределения

а) рассчитать асимметрию;

б) рассчитать эксцесс;

в) определить существенность асимметрии и эксцесса;

г) оценить соответствие эмпирического ряда распределения теоретическому по критериям Пирсона, Колмогорова (Приложения В, Г).

а) Коэффициент асимметрии определяется как отношение разницы между средней и модой к среднему квадратическому отклонению (показатель Пирсона):


где  - коэффициент асимметрии;

* - средняя арифметическая взвешенная;

* - мода;

* - среднее квадратическое отклонение для сгруппированных данных.

Рассчитаем асимметрию для объема продаж.

=0,25

Рассчитаем асимметрию для численности работников.

 =0,63

Существенность асимметрии:

Рассчитаем этот показатель для объема продаж и сравним его с коэффициентом асимметрии.

Асимметрия равна 1,7, >0, это говорит о том, что асимметрия правосторонняя (первый признак).

Теперь рассчитаем данный показатель для численности работников и сравним его с коэффициентом асимметрии.

,

Имеет место асимметрия, равная 0, т. е ряд абсолютно симметричен.

б) Для оценки крутизны данного распределения в сравнении с нормальным вычисляется эксцесс распределения. Эксцесс рассчитывается по формуле:

где  - эксцесс;

 - центральный момент четвертого порядка;

* - среднее квадратическое отклонение для сгруппированных данных.

Центральный момент четвертого порядка:

где  - центральный момент четвертого порядка;

 - центральный вариант i-го интервала;

* - средняя арифметическая взвешенная;

 - частота i-й группы.

Рассчитаем центральный момент четвертого порядка и эксцесс для объема продаж.

= - 0,82

Эксцесс отрицателен, следовательно, эмпирическая кривая распределения низковершинна по сравнению с нормальным распределением.

Рассчитаем центральный момент четвертого порядка и эксцесс для численности работников.

= - 1,07

Эксцесс отрицателен, значит крутизна распределения меньше нормального.

в) Определим существенность эксцесса. Распределение можно считать нормальным, если показатель эксцесса не превышает своего двукратного среднего квадратического отклонения, которое вычисляется по формуле:

Определим существенность эксцесса для объема продаж.

Определим существенность эксцесса для стажа по специальности.

г) Критерий Пирсона рассчитывается по формуле:


где  - критерий согласия Пирсона;

 - эмпирические частоты;

 - теоретические частоты.

Критерий Романовского:

где  - критерий Романовского;

* - критерий Пирсона;

* - количество групп.

Критерий Колмогорова:

где  - критерий Колмогорова;

 - максимальная разность между накопленными теоретическими и эмпирическими частотами;

 - численность совокупности.

Рассчитаем данные критерии для объема продаж.

Критерий Пирсона.

При вероятности Р = 0,95 и числе степеней свободы К = 2 расчетное значение меньше теоретического, следовательно гипотеза о близости эмпирического распределения к нормальному не опровергается.

Критерий Романовского

Значение критерия Романовского меньше 3, значит, распределение является нормальным. Расхождения между эмпирическими и теоретическими частотами можно считать случайными.

Критерий Колмогорова.

Р (λ) =1

Таким образом, с вероятностью, равной 1, можно утверждать, что отклонения эмпирических частот от теоретических случайны.

Рассчитаем данные критерии для численности работников

Критерий Пирсона.

Расчетное значение критерия Пирсона меньше теоретического значит, распределение соответствует нормальному.

Критерий Романовского.


Значение критерия Романовского меньше 3, значит, распределение является нормальным. Расхождения между эмпирическими и теоретическими частотами можно считать случайными. Критерий Колмогорова.

Р (λ) =1

Таким образом, с вероятностью, равной 1, можно утверждать, что отклонения эмпирических частот от теоретических случайны, следовательно, можно считать, что в основе эмпирического распределения совокупности по уровню предприятий по коэффициенту сменности лежит закон нормального распределения.

1.9 Произвести аналитическую группировку по двум признакам, построив аналитическую таблицу

При построении аналитической таблицы независимый (факторный) признак расположить в строках таблицы, а зависимый перегруппировать во взаимосвязи с факторным. Провести корреляционно-регрессионный анализ:

а) построить поле корреляции;

б) рассчитать коэффициенты регрессии, эластичности. Сделать оценку уравнения регрессии, рассчитав среднюю квадратическую ошибку уравнения регрессии. Оценить значимость линии регрессии, выражающей связь между двумя признаками, сравнив среднюю квадратическую ошибку уравнения регрессии со средним квадратическим отклонением, рассчитанным по зависимому признаку;

в) рассчитать линейный коэффициент корреляции;

г) эмпирическое корреляционное отношение;

д) теоретическое корреляционное отношение;

е) коэффициент корреляции рангов Спирмэна;

ж) коэффициент ранговой корреляции Кендалла;

з) коэффициент Фехнера;

и) произвести оценку достоверности коэффициента корреляции по критерию Фишера (Приложение Д).

Для исследования зависимости между явлениями используют аналитическую группировку. При их построении можно установить взаимосвязь между двумя признаками и более. При этом факторными будут называться признаки, под воздействием которых изменяются результативные признаки. Представим аналитическую группировку в таблице 9.1.


Таблица 9.1 Аналитическая группировка

Объем продаж Численность работников Итого:
420-429 429-438 438-447 447-456 456-465 465-473
5100-5210 2 2
5210-5320 1 5 6
5320-5430 2 2 2 6
5430-5560 2 2 2 2 8
5560-5670 2 1 1 1 5
Итого: 3 5 6 5 5 3 27

а) Корреляционную зависимость для наглядности можно изобразить графически. Для этого, имея n взаимосвязанных пар значений x и y, пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. А затем на фоне "корреляционного поля" строится средняя линия. Представим поле корреляции на рисунке 9.1.

Рисунок 9.1 Поле корреляции

Условные обозначения:

х - стаж по специальности;

у - средняя зарплата;

1 - линия тренда.

б) Уравнение линии, выбранной для выравнивания y, называется уравнением регрессии. Параметры уравнения регрессии а и а рассчитываются из системы уравнений, составленной по методу наименьших квадратов: Суть метода в том, что линия пройдет в максимальной близости от эмпирических точек.

где  - зависимый признак;  - коэффициенты уравнения прямой;  - независимый признак; *- число выборки.


Составим уравнение регрессии:

y=5207+13,7х

Средняя линия представлена на рисунке 9.1.

Рассчитаем коэффициент эластичности. Он показывает, на сколько процентов изменится в среднем результативный признак y при изменении факторного признака x на 1%. Этот коэффициент рассчитываться по формуле:

где  - коэффициент эластичности;

 - коэффициент при  в уравнении прямой;

* - среднее значение факторного признака;

* - среднее значение зависимого признака.

Таким образом, при изменении численности рабочих на 1%, объем продаж изменится на 1,1%

в) Линейный коэффициент корреляции. Он строится на основе отклонения индивидуальных значений х и у от соответствующей средней величины и рассчитывается по формуле:

где  - линейный коэффициент корреляции;

 - среднее произведение факторного признака на зависимый;

 - произведение факторного признака на зависимый;

 - простая средняя арифметическая факторного признака;

 - простая средняя арифметическая зависимого признака;

 - среднее квадратическое отклонение по зависимому признаку;

* - среднее квадратическое отклонение по факторному признаку.


Найдем среднюю из произведений ху:

Теперь можно найти непосредственно линейный коэффициент корреляции:

Этот коэффициент свидетельствует о том, что между известными признаками существует прямая связь, т.е. при увеличении числености аботников объем продаж увеличивается.

г) Эмпирическое корреляционное отношение.

С его помощью можно измерить тесноту связи. Этот коэффициент рассчитывается по формуле:

Таким образом, в нашем случае эмпирическое корреляционное отношение равно:

Полученное значение характеризует тесноту связи близкую к максимальной, значит можно сделать вывод о наличии существенной связи между уровнем объема продаж и численности работников.

д) Рассчитаем теоретическое корреляционное отношение:


где  - теоретическое корреляционное отношение;  - общая дисперсия зависимого признака по несгруппированным данным;

- остаточная дисперсия;

 - теоретическое значение;

 - простая средняя арифметическая эмпирического ряда;

 - численность совокупности.

Для этого сделаем расчет следующих параметров (Таблица 9.2):

Таблица 9.2

Расчет среднеквадратичного отклонения теоретических значений от средней эмпирического ряда

Численность рабочих Теоретические значения

-

 (-) 2

424
422
433
446
455
432
443
434
437
438
444
423
442
444
443
455
452
457
455
450
462
462
464
460
471
472
470

5220
5120
5180
5225
5450
5465
5326
5350
5390
5375
5271
5312
5320
5348
5410
5440
5456
5440
5470
5460
5435
5310
5560
5596
5553
5650
5650

-179

279

219

174

51

66

73

49

9

24

128

87

79

51

11

41

57

41

71

61

36

89

161

197

154

251

251

32041

77841

47961

30276

2601

4356

5329

2401

81

576

16384

7569

6241

2601

121

1681

3249

1681

5041

3721

1296

7921

25921

38809

23716

63001

63001

Итого: 475417

Найдем остаточную дисперсию:

Рассчитаем теоретическое корреляционное отношение:

Итак, теоретическое корреляционное отношение равно 1, следовательно, между коррелируемыми величинами существует большая зависимость.

е) Коэффициент корреляции Спирмэна. Для расчета этого коэффициента необходимо привести таблицу корреляции рангов (таблица 9.3).

Таблица 9.3 Корреляция рангов

х Rx Rxy y Ry Rxy d знаки
х у
424 3 3 5220 3 3 0 - -
422 1 1 5120 1 1 0 + +
433 5 5 5180 2 2 3 - -
446 14 14 5225 4 4 10 + +
455 17 17 5450 18 18 -1 - -
432 4 4 5465 21 21 -17 + +
443 10 10 5326 9 9 1 - -
434 6 6 5350 11 11 -5 + +
437 7 7 5390 13 13 -5 - -
438 8 8 5375 12 12 -4 + +
444 12 12 5271 5 5 7 - -
423 2 2 5312 7 7 -5 + +
442 9 9 5320 8 8 1 - -
444 13 13 5348 10 10 3 + +
443 11 11 5410 14 14 -3 - -
455 18 18 5440 16 16 2 + +
452 16 16 5456 19 19 -3 - -
457 20 20 5440 17 17 3 + +
455 19 19 5470 22 22 -3 - -
450 15 15 5460 20 20 -5 + +
462 22 22 5435 15 15 7 - -
462 23 23 5310 6 6 17 + +
464 24 24 5560 24 24 0 - -
460 21 21 5596 25 25 -4 + +
471 26 26 5553 23 23 3 + +
472 27 27 5650 26 26 1 + +
470 25 25 5650 27 27 -2

Ранг - это порядковый номер, присеваемый каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать в одном и том же порядке: от меньших значений к большим и наоборот. Если встречается несколько одинаковых значений признака, то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений.

Страницы: 1, 2, 3


© 2010 Собрание рефератов