Рефераты

Учебное пособие: Статистика

3)         величина интервала =4,0 тыс. грн.

4)         численность выборочной совокупности =100.

Необходимо проверить гипотезу о соответствии эмпирического распределения предприятий нормальному.

Таблица 1

Среднее значение интервала, тыс. грн Фактическое количество предприятий
16 9
20 45
24 16
28 24
32 18
36 12
40 6
Всего 100

Тесты для закрепления материала

Тест 1

В статистике критерий Стьюдента обозначается:

а)  критерий;

б) ;

в) критерий.

Тест 2

Мощность критерия – это:

а) вероятность отклонения испытуемой нулевой гипотезы, когда правильною является альтернативная гипотеза;

б) те значения критерия, при которых нулевую гипотезу отклоняют;

в) такое малое значение вероятности попадания критерия в критическую область при условии справедливости гипотезы, что появление этого события может расцениваться как следствие существенного расхождения выдвинутой гипотезы и результатов выборки.

Тест 3

Выберите ряд критериев согласия:

а) Пирсона;

б) Колмогорова;

в) Фишера;

г) Стьюдента;

д) Смирнова;

е) Ястремского;

ж) Романовского.

Литература:

1.   Ефимова М.Р. , Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. Изд. 2-е, испр. и доп. – М.:ИНФА-М, 2002. – 416 с.

2.   Теорія статистики: Навчальний посібник / Вашків П.Г., Пастер П.Ш., Сторожук В.П., Ткач Є.Ш. – К.: Либідь, 2001. - 320 с.

3.   Статистика: Підручник / С.С. Герасименко, А.В. Головач та ін. 2-е вид., перероб. і доп. – К. : КНЕУ, 2000. 467 с.

4.   Мармоза А.Т. Практикум з основ статистики. К.: Ельга, Ніка-Центр, 2003. – 344 с.

5.   Сборник задач по общей теории статистики. Учебное пособие. Изд. 2-е. /Под ред. Серга Л.К. – М.: Информационно-издательский дом «Филин», Рилант, 2001. – 360 с.


Тема 8. Статистические методы анализа корреляционных связей

План лекционных занятий

15. Методы анализа взаимосвязей.

15.1.   Виды взаимосвязей.

15.2.   Регрессионный анализ.

16. Проверка существенности корреляционной связи.

16.1.   Оценка плотности.

16.2.   Ранговая корреляция.

Методические указания

Все явления окружающего мира, социально-экономические в частности, взаимосвязаны и взаимообусловлены. В сложном переплетении всеобъемлющей взаимосвязи какое-либо явление является следствием действия определённого множества причин и одновременно – причиною других явлений.

Определяющая цель измерения взаимосвязей – выявить и дать количественную характеристику причинных связей. Суть причинной связи состоит в том, что в определённых условиях одно явление вызывает другое. Причина сама по себе не определяет следствие, последнее зависит также от условий, в которых действует причина. Изучая закономерности связи, причины и условия объединяют в одно понятие «фактор». Соответственно, признаки, характеризующие факторы, называют факторными, а те, которые характеризуют последствия, - результативными.

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производимой продукции.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтённые случайные величины. По направлению связи бывают прямыми, когда зависимая переменная растёт с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.

Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.

С точки зрения взаимодействующих факторов связь бывает парной – если характеризуется связь двух признаков, и множественной – если изучаются более, чем две переменные.

По виду бывают непосредственные – факторы взаимодействуют между собой непосредственно; косвенные – характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками; ложная – это связь, установленная формально и, как правило, подтверждённая только количественными оценками, она не имеет под собой качественной основы или вообще бессмысленна.

По силе различают слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.

Задачи корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной.

Количественная взаимосвязь факторов называется регрессией. А важной характеристикой корреляционной связи является линия регрессии – эмпирическая в модели аналитической группировки и теоретическая в модели регрессионного анализа. Недостаток эмпирических линий состоит в небольшой точности и практически невозможной алгоритмизации полученных зависимостей.

Эмпирическая линия регрессии представлена групповыми средними результативного признака , каждая из которых принадлежит соответствующему интервалу значений группировочного фактора . Теоретическая линия регрессии описывается определённой функцией , которую называют уравнением регрессии, а  - теоретическим уровнем результативного признака.

Разные явления по разному реагируют на изменение факторов. Для того, чтобы отобразить характерные особенности связи конкретных явлений, статистика использует разные по функциональному виду регрессионные уравнения:

·           если при изменении фактора  результат  изменяется более-менее равномерно, такая связь описывается линейной функцией ;

·           если неравномерное соотношение вариаций взаимосвязанных признаков (например, когда прирост значений при смене  ускорен или замедлен, или направление связи изменяется), используют нелинейные регрессии:

1.         Степенную ;

2.         Гиперболическую ;

3.         Параболическую .

Наряду с определением характера связи и эффекта влияния факторов  на результат  важное значение имеет оценка плотности связи – то есть оценка согласованности вариации взаимосвязанных признаков. Если влияние факторного признака  на результативный  существенный, это проявится в закономерной смене значений  при смене значений , то есть фактор  своим влиянием формирует вариацию . При отсутствии связи вариация  не зависит от вариации .

Для оценки плотности связи статистика использует группу коэффициентов с такими общими особенностями:

·           при отсутствии какой-либо связи значение коэффициента приближается к нулю; при функциональной связи – к единице;

·           при наличии корреляционной связи коэффициент выражается дробью, которая по абсолютной величине тем больше, чем плотнее связь.

Среди мер плотности связи самым распространённым является:

1) коэффициент корреляции Пирсона - . Поскольку сфера его использования ограничивается линейной зависимостью, то и в названии его фигурирует слово «линейный».

Коэффициент корреляции определяется по формуле:

.

2) Коэффициент детерминации – квадрат коэффициента корреляции (), показывающий, какая часть общей вариации результативного признака определяется исследуемым фактором.

3) Мерою плотности связи является также корреляционное отношение:

,

где  - межгрупповая дисперсия, которая измеряет вариацию признака  под влиянием фактора ,

 - общая дисперсия.

Корреляционное отношение показывает, сколько процентов вариации признака объясняется вариацией фактора и используется для оценки плотности связи по данным аналитической группировки (например, для оценки плотности связи между глубиной разработки угольных пластов и фондоёмкости добычи угля).

Взаимосвязь между признаками, которые можно ранжировать, прежде всего, на основе бальных оценок, измеряется методами ранговой корреляции. Упорядочение единиц совокупности по значению признака называется ранжированием. Рангами называются числа натурального ряда, которые согласно значениям признака присваиваются элементам совокупности и в определённой степени упорядочивают её. Ранжирование проводится по каждому признаку отдельно: первый ранг присваивается наименьшему значению признака, последний – наибольшему или наоборот. Количество рангов равно объёму совокупности. Учитывая то, что ранговая корреляция не требует соблюдения каких-либо математических предпосылок распределения признаков, ранговые оценки плотности связи целесообразно использовать для совокупностей небольшого объёма.


Решение типовых задач

Задача 1.

С помощью методов периодизации выделены периоды однотипной динамики безработицы и преступности.

1.         По одному из таких периодов с помощью линейного коэффициента корреляции определите наличие связи между числом преступлений и численностью лиц, не занятых в экономике. Дайте оценку.

2.         Постройте уравнение регрессии.

3.         Нанесите на график эмпирическую и теоретическую линии регрессии.

Таблица 1

Год Лица в трудоспособном возрасте, не занятые в экономике, тыс. чел. Число зарегистрированных преступлений
1999 117,1 54 929
2000 134,7 77 915
2001 191,9 86 615
2002 215,0 72 404

Ход решения:

Так как с увеличением числа лиц в трудоспособном возрасте (), не занятых в экономике, равномерно увеличивается число зарегистрированных преступлений (), то оценку зависимости проводим с помощью линейного уравнения регрессии, а оценку тесноты связи линейного коэффициента корреляции.

1.         Линейный коэффициент корреляции рассчитывается по формуле:

=.

2.         Уравнение прямой, с помощью которой оценивается форма зависимости изучаемых показателей, имеет вид:

,

где  - теоретическое число зарегистрированных преступлений;

 - численность лиц в трудоспособном возрасте, не занятых в экономике;

 - параметры уравнения прямой, определяемые системой нормальных уравнений:


;

Откуда

.

Для определения параметров уравнения регрессии и линейного коэффициента корреляции строим таблицу и находим параметры уравнения:


Таблица 2

Годы

1 2 3 4 5 6 7
1999 117,1 54 929 6432185,9 13712,41 65183 3017195041
2000 134,7 77 915 10495150,5 18144,09 68062 6070747225
2001 191,9 86 615 16621418,5 36825,61 77420 7502158225
2002 215,0 72 404 15566860 46225,00 81199 522339216
Итого 658,7 291 863 49115614,9 114907,11 291863 21832439707

Линейный коэффициент корреляции:

Полученное значение коэффициента корреляции свидетельствует о заметной (умеренной) связи между численностью лиц в трудоспособном возрасте, не занятых в экономике, и числом зарегистрированных преступлений.

Найдём по формулам параметры уравнения:

Уравнение корреляционной связи примет вид:

Подставив в это уравнение значения , определяют теоретические значения . Так,

.

и т.д.

Теоретические значения приведены в табл. 2.

Задачи для самостоятельного выполнения

Задача №2.

По 10 совхозам есть данные об урожайности зерновых культур и качестве грунта. Необходимо провести корреляционно-регрессионный анализ связи между двумя признаками – урожайностью и качеством грунта. Для характеристики этой связи необходимо определить: 1) форму связи и математическое уравнение связи, для чего построить график корреляционной зависимости между урожайностью ( - результативный признак) и качеством грунта ( - факторный признак); 2) параметры уравнения регрессии; 3) тесноту связи (коэффициенты корреляции и детерминации).

Таблица 1

Урожайность, ц/га Качество грунта, баллов Расчётные величины

1 2 3 4 5 6 7
1 28,0 79 2212,0 784,00 6241 27,84
2 21,0 70 1470,0 441,00 4900 19,48
3 27,6 80 2208,0 761,76 6400 28,77
4 16,2 71 1150,2 262,44 5041 20,40
5 29,7 77 2286,9 882,09 5929 25,98
6 26,8 77 2063,6 718,24 5929 25,98
7 30,3 84 2545,2 918,09 7056 32,48
8 15,7 66 1036,2 246,49 4356 15,77
9 25,5 74 1887,0 650,25 5476 23,20
10 15,8 67 1058,6 249,64 4489 16,70
Всего 236,6 745 17917,7 5914,00 55817 236,60
В среднем 23,66 74,5 1791,77 591,40 5581,7 23,66

Задача № 3.

По данным задачи №2 необходимо осуществить статистическую проверку существенности выборочных коэффициентов регрессии и корреляции, найти интервалы, в которых находятся их значения в генеральной совокупности. Уровень значимости .

Задача № 4.

По группе коров симментальской породы есть данные о возрасте и продуктивности, то есть о среднегодовом надое (табл.1). Установить формы связи между двумя признаками, определить параметры уравнения регрессии, тесноту связи.

Таблица 1

Данные для расчёта показателей корреляционной связи

Суточный надой, кг Возраст, лет Расчётные данные

1 2 3 4 5 6 7 8 9
1 8 3
2 7 3
3 9 4
4 5 6
5 12 5
Всего 41 21

Тесты для закрепления материала

Тест 1

По направлению связи бывают:

а) прямыми и обратными;

б) линейными и нелинейными;

в) парными и множественными;

г) непосредственными и косвенными;

д) сильными и слабыми.

Тест 2

По аналитической форме связи бывают:

а) прямыми и обратными;

б) линейными и нелинейными;

в) парными и множественными;

г) непосредственными и косвенными;

д) сильными и слабыми.

Тест 3

Ранжированием называется:

а) возведение в квадрат коэффициента корреляции;

б) упорядочение единиц совокупности по значению признака;

в) оценка согласованности вариации взаимосвязанных признаков.

Литература:

1.   Ефимова М.Р. , Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. Изд. 2-е, испр. и доп. – М.:ИНФА-М, 2002. – 416 с.

2.   Теорія статистики: Навчальний посібник / Вашків П.Г., Пастер П.Ш., Сторожук В.П., Ткач Є.Ш. – К.: Либідь, 2001.-320 с.

3.   Статистика: Підручник / С.С. Герасименко, А.В. Головач та ін. 2-е вид., перероб. і доп. – К. : КНЕУ, 2000. 467 с.

4.   Статистика: Учебное пособие/Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др.; Под ред. В.Г. Ионина. – Изд. 2-е, перераб. и доп. – М.: ИНФРА-М, 2002. – 384 с.

5.   Мармоза А.Т. Практикум з основ статистики. К.: Ельга, Ніка-Центр, 2003. – 344 с.

6.   Сборник задач по общей теории статистики. Учебное пособие. Изд. 2-е. /Под ред. Серга Л.К. – М.: Информационно-издательский дом «Филин», Рилант, 2001. – 360 с.


Тема 9. Анализ таблиц взаимной сопряжённости

План лекционных занятий

17. Анализ таблиц взаимной сопряжённости.

17.1.   Оценка согласованности вариации атрибутивных признаков.

17.2.   Коэффициенты контингенции и ассоциации.

Методические указания

Взаимосвязи между атрибутивными признаками анализируются на основе таблиц взаимной сопряжённости (взаимозависимости).

Оценка плотности стохастичной связи базируется на отклонениях частот условного и безусловного распределений, то есть на отклонениях фактических частот  от теоретических , пропорциональных итоговым:

,

где  - итоговые частоты по признаку ;

 - итоговые частоты по признаку ;

 - объём совокупности ().

Абсолютную величину отклонений фактических частот  от пропорциональных  характеризует коэффициент взаимной сопряжённости Пирсона :

.

При отсутствии стохастичной связи =0. На основе распределения вероятностей проверяется существенность связи.

Относительной мерой плотности стохастичной связи служит коэффициент взаимной сопряжённости (взаимозависимости). Если , то использую формулу Чупрова:

,

где  - число групп по признаку ;

 - число групп по признаку .

При отсутствии связи между признаками , то и . При функциональной связи .

Коэффициент Чупрова даёт более осторожную оценку связи.

Когда , использую коэффициент сопряжённости Крамера:

,

где - минимальное число групп (или ).

В нашем примере =3, поэтому приведённые формулы коэффициента взаимной сопряжённости тождественны:

,

это свидетельствует о наличии связи.

Если оба взаимосвязанных признака альтернативные, то количество групп = 2, при отсутствии связи произведения диагональных частот одинаковые: .

Тесноту связи между атрибутивными признаками можно измерять с помощью специальных коэффициентов ассоциации и контингенции, предложенных соответственно Д. Юлом и К. Пирсоном. Чтобы их вычислить строят 4-клеточную таблицу, которая показывает связь между двумя признаками, каждый их которых должен быть альтернативным, то есть таким, что состоит из двух качественно отличных один от другого значений (например, земли удобрены или нет).

Коэффициенты вычисляются по таким формулам:

Ассоциации

,

Контингенции

.

Эти коэффициенты могут быть разных значений от –1 до +1. Коэффициент контингенции всегда меньше коэффициента ассоциации. Величины этих коэффициентов как показателей тесноты связи трактуют, как и величину коэффициента корреляции.

Полезной мерой при анализе 4-клеточных таблиц взаимной сопряжённости является отношение перекрёстных произведений или отношение шансов:

.

Отношение шансов характеризует меру относительного риска.

Следует отметить, что методы анализа таблиц взаимной сопряжённости можно использовать и для количественных признаков. Какие-либо технические преграды отсутствуют. Но следует помнить, что коэффициент сопряжённости оценивает лишь согласованность фактического распределения с пропорциональным. При переставлении столбцов или строк значение коэффициента  не изменяется. Меры плотности корреляционной связи – коэффициент детерминации  и корреляционное отношение  - оценивают не только согласованность частот, но и порядок, последовательность, в которой объединяются разные значения признаков. То есть эти характеристики связи более мощные. А в целом выбор метода измерения связи и характеристики его плотности должен базироваться на предварительном теоретическом анализе сути явлений, характера взаимосвязи, имеющейся информации

Литература:

1.   Ефимова М.Р. , Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. Изд. 2-е, испр. и доп. – М.:ИНФА-М, 2002. – 416 с.

2.   Теорія статистики: Навчальний посібник / Вашків П.Г., Пастер П.Ш., Сторожук В.П., Ткач Є.Ш. – К.: Либідь, 2001. - 320 с.

3.   Статистика: Підручник / С.С. Герасименко, А.В. Головач та ін. 2-е вид., перероб. і доп. – К. : КНЕУ, 2000. 467 с.

4.   Статистика: Учебное пособие / Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др.; Под ред. В.Г. Ионина. – Изд. 2-е, перераб. и доп. – М.: ИНФРА-М, 2002. – 384 с.

5.   Мармоза А.Т. Практикум з основ статистики. К.: Ельга, Ніка-Центр, 2003. – 344 с.

6.   Сборник задач по общей теории статистики. Учебное пособие. Изд. 2-е. /Под ред. Серга Л.К. – М.: Информационно-издательский дом «Филин», Рилант, 2001. – 360 с.


Тема 10. Анализ интенсивности динамики

План лекционных занятий

18. Ряды динамики.

18.1.   Классификация рядов динамики.

18.2.   Характеристики интенсивности динамики.

18.3.   Анализ рядов динамики.

Методические указания

Рядом динамики называется ряд статистических чисел, которые характеризуют изменения величины общественного явления во времени.

В каждом ряду динамики имеются два основных элемента:

1)   показатель времени « t »;

2)   уровни развития изучаемого явления «y».

В качестве показателей времени в рядах динамики выступают либо определённые даты (моменты) времени, либо отдельные периоды (сутки, месяцы, кварталы). Уровни рядов динамики отображают количественную оценку развития во времени изучаемого явления. Они могут выражаться абсолютными, относительными и средними величинами. Динамические ряды имеют свои уровни:

-      начальные;

-      конечные;

-      средние.

В зависимости от характера изучаемого явления уровни рядов динамики могут относиться или к определённым датам (моментам) времени, или к отдельным периодам времени. В соответствии с этим ряды динамики подразделяются на два вида:

1. Моментный ряд – это ряд динамики, уровни которого характеризуют размеры общественно-экономических явлений по состоянию на определённый момент. Особенностью моментного ряда динамики является то, что в его уровни могут входить одни и те же единицы изучаемой совокупности. Поэтому при суммировании уровней моментного ряда динамики может возникнуть повторный счёт.

2. Периодический (интервальный ряд) – это ряд динамики, уровни которого характеризуют размеры общественно-экономических явлений за определённые периоды времени (неделя, месяц, полугодие). Особенностью периодического ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы времени.

Важнейшее условие правильного построения и исследования рядов динамики – сопоставимость уровней этих рядов, относящихся к различным периодам. Сопоставимость данных статистики – это соответствие условий и методов расчёта её показателей, обеспечивающих правильность получаемых при их сравнении выводов о различиях между изучаемыми явлениями. Данное условие решается либо в процессе сбора и обработки данных, либо путём их пересчёта. Соблюдение требований к сопоставимости уровней ряда означает, что научно обоснованным будет такое сравнение, которое учитывает существо изучаемого явления и цель, к которым оно приводится.

Требования к сопоставимости показателей динамического ряда:

1.    Все показатели РД должны быть достоверными, точными, научно обоснованными.

2.    Интервалы времени должны быть сходны в экономическом отношении. Например, объём производства зерна за различные годы следует сравнивать только за определенный месяц.

3.    Единицы измерения должны быть единые. Например, только литры или только килограммы.

4.    Показатели должны иметь одну и ту же полноту охвата исследуемых объектов, то есть должны быть сопоставимы по составу.

5.    Уровни РД должны иметь единые способы исчисления, например, численность работающих исчислена на начало каждого года, а по другим годам – как среднегодовая численность. Такие РД непригодны.

6.    Показатели РД должны быть сопоставимы по территории, к которым они относятся. Например, изменение границ и численность населения.

В статистике для того, чтобы выявить особенности развития изучаемых явлений и процессов за отдельные периоды времени, исчисляются абсолютные и относительные показатели изменения ряда динамики:

1)   абсолютный прирост.

2)   средний абсолютный прирост.

3)   абсолютное значение одного процента прироста.

4)   темп роста.

5)   темп прироста.

6)   средний темп роста.

7)   средний темп прироста.

В основе расчёта показателей РД лежит сравнение его уровней. В зависимости от применяемого способа сопоставления показатели динамики могут вычисляться на постоянной или переменной базах сравнения.

Для расчёта показателей динамики на постоянной базе каждый уровень ряда сравнивается с одним и тем же базисным уровнем. Исчисленные при этом показатели считаются базисными. Для расчёта показателей динамики на переменной базе каждый последующий уровень ряда сравнивается с предыдущим. Вычисленные таким образом показатели динамики называются цепными.

1.   Абсолютный прирост () – это разность между уровнями данного периода и периода, принятого за базу сравнения (предыдущего периода). Он вычисляется по формулам:

а) базисный

б) цепной

 - абсолютный прирост базисный.

- абсолютный прирост цепной.

- сравниваемый уровень.

- уровень периода, взятого за базу.

- уровень, предшествующий сравниваемому периоду.

2.   Средний абсолютный прирост представляет собой обобщённую характеристику индивидуальных абсолютных приростов ряда динамики. Он определяется по формулам:

Страницы: 1, 2, 3, 4, 5, 6, 7


© 2010 Собрание рефератов