Рефераты

Реферат: Зведення та групування даних

Реферат: Зведення та групування даних

Зведення та групування даних

За даними бюджетних обстежень 20 домогосподарств ( наведені в таблиці ) згрупувати домогосподарства за кількістю членів та загальним грошовим доходом, побудувати комбінаційне групування за вказаними ознаками, побудувати аналітичне групування , яке б характеризувало зв’язок між середньодушовим доходом та кількістю членів домогосподарств та типологічне групування, виділивши групи бідних, середніх та заможних домогосподарств.

Таблиця 1.

Порядковий номер домогосподарства Кількість членів домогосподарства Загальний грошовий доход, включаючи трансферти, гр. од. Середньодушовий доход, гр. од.

Гр. 1

Гр. 2

Гр. 3

Гр. 4

1 2 185 92,5
2 3 268 89,3
3 4 539 134,7
4 2 193 96,5
5 3 473 157,6
6 3 324 108,0
7 4 710 177,5
8 3 172 57,3
9 4 248 62,0
10 2 350 175,0
11 3 516 172,0
12 3 374 124,7
13 4 450 112,5
14 3 603 201,0
15 3 229 76,3
16 2 368 184,0
17 4 313 78,3
18 3 346 115,3
19 3 447 149,0
20 4 392 98,0

Розв’язання.

Кількість членів домогосподарств є дискретною ознакою групування зводиться до підрахунку числа домогосподарств для кожного значення ознаки. Число груп визначається кількістю різних значень ознаки: 2, 3, 4. Слід відмітити, що різних значень ознаки не багато, тому кожне наступне значення визначатиме групу. Результати групування представимо в таблиці 2.


Таблиця 2.

Чисельність членів домогосподарства Кількість домогосподарств В % до підсумку

Гр. 1

Гр. 2

Гр. 3 =(гр. 2 : 20) . 100

2 4 20
3 10 50
4 6 30
В цілому 20 100

Грошовий місячний дохід – ознака неперервна, межі її варіац досить широкі – від 172 до 710 грн. од., а тому доцільно складати інтервальний ряд розподілу, враховуючи характер розподілу. Визначимо етапи проведення групування.

1. За формулою Стерджеса , де N – кількість спостережень визначимо необхідну кількість груп:

2. Обчислимо ширину інтервалу за формулою  

3. Знайдемо межі інтервалів за формулами, . Дані запишемо в таблиці.

Таблиця 3.

Загальний грошовий доход домогосподарства, гр. од. Кількість домогосподарств В % до підсумку

Гр. 1

Гр. 2

Гр. 3 =(гр. 2 : 20) . 100

172 – 279,6 6 30
279,6  - 387,2 6 30
387,2 – 494,8 4 20
494,8  - 602,4 2 10
602,4 - 710 2 10
В цілому 20 100

Слід зазначити, що нижні межі інтервалів ми будемо включати до інтервалу, а верхні – ні. В інтервал 602,4 – 710 включаємо обидві межі.

В багатьох випадках кількість інтервалів та ширину інтервалу дослідник визначає сам. Інтервали можуть бути відкритими та закритими. 

Наприклад, виконаємо теж завдання, але сформуємо чотири нтервали: До 200; 200 – 400; 400 – 600; 600 і більше.


Таблиця 4.

Загальний грошовий доход домогосподарства, гр. од. Кількість домогосподарств В % до підсумку

Гр. 1

Гр. 2

Гр. 3 =(гр. 2 : 20) . 100

До 200 3 15
200 400 10 50
400 – 600 5 25
600 більше 2 10
В цілому 20 100

 Групування домогосподарств одночасно за двома ознаками да комбінаційний розподіл. В таблиці підметом буде групування за факторною ознакою (в даному випадку - за кількістю членів домогосподарств), а групи за результативною ознакою (загальний грошовий дохід ) розмістимо вгорі.

Таблиця 5.

Чисельність членів домогосподарства Загальний грошовий доход домогосподарства, гр. од. В цілому
До 200 200 - 400 400 - 600 600 і більше
2 2 2 - - 4
3 1 5 3 1 10
4 - 3 2 1 6
В цілому 3 10 5 2 20

Для побудови даного групування необхідно підрахувати кількість домогосподарств, які одночасно належать до певної групи за факторною ознакою та до тієї чи іншої групи за результативною ознакою. В нашому випадку ми маємо, наприклад, 5 домогосподарств, кількість членів яких дорівнює 3 загальний грошовий дохід яких не менше 200 і не більше 400 гр. од. і т. д.

Розміщення частот таблиці у напрямку з верхнього лівого кута у нижній правий вказує на наявність прямого зв’язку між факторною та результативною ознакою, в нашому випадку – між чисельністю членів домогосподарств та загальним грошовим доходом домогосподарств.

Розміщення частот таблиці у напрямку з нижнього лівого кута у верхній правий вказує на наявність зворотного зв’язку між факторною та результативною ознакою.

Виявити наявність та напрямок зв’язку між двома ознаками можна за допомогою аналітичного групування. Для його побудови знайдемо середн значення результативної ознаки в кожній групі за факторною ознакою. Результати представимо в таблиці 6.

Таблиця 6.

Чисельність членів домогосподарства Кількість домогосподарств Сумарна кількість членів домогосподарств Дохід за місяць, гр. од.
Загальний грошовий У середньому
На одне домогосподарство На одного члена домогосподарства

Гр. 1

Гр. 2

Гр. 3 = гр. 1 . гр. 2

Гр. 4

Гр. 5 = гр. 4 : гр. 2

Гр. 4 = гр. 4 : гр. 3

2 4 8 1096 274,0 137,0
3 10 30 3752 375,2 125,1
4 6 24 2652 442,0 110,5
В цілому 20 62 7500 375,0 121,0

За даними таблиці 6 із збільшенням кількості членів домогосподарства зростає середній дохід на одне домогосподарство, але середньодушовий дохід зменшується.

Паралельне зіставлення групових значень факторної та результативної ознак да можливість визначити не лише напрямок зв’язку, а й інтенсивність  змін результативної ознаки. За умови рівномірного нарощування значень факторно ознаки різниця між груповими середніми результативної ознаки використовується для оцінки ефекту впливу фактора на результат. Ефект впливу другої групи 125,1 137,0 = - 11,9 гр. од.; третьої групи 110,5 – 125,1 = - 14,6 гр. од., тобто  нтенсивність впливу фактора на результат зростає.

Згідно з методикою Європейської комісії ООН до бідних віднесено домогосподарства, середньодушовий доход яких не перевищує 2/3 середньодушового рівня за сукупністю в цілому. До середнього прошарку віднесено домогосподарства, середньодушовий доход яких знаходиться в інтервалі Домогосподарства із середньодушовим доходом   більше ідентифікуються як заможні. В нашому випадку межею бідності є  гр. од. До середнього прошарку віднесемо домогосподарства, середньодушовий доход яких належить нтервалу 121 ± 121/3, тобто від 181 до 161 гр. од. Домогосподарства з середньодушовим доходом 161 гр. од. І більше ідентифікуються як заможні.

Таблиця 7.

Середньодушовий дохід, гр. од. Кількість Загальний грошовий дохід домогосподарств, гр. од. Середньодушовий дохід, гр. од.
домогосподарств членів домогосподарств

Гр. 1

Гр. 2

Гр. 3

Гр. 4

Гр. 5 = гр. 4 : гр. 3

До 81 4 14 962 68,7
81 161 11 34 3991 117,4
161 більше 5 14 2547 181,9
За сукупністю в цілому 20 62 7500 121,0

За результатами групування середньодушовий дохід в групах становить: 181,9; 117,4; 68,7 гр. од., тобто дохід заможних домогосподарств  в 2,6 рази перевищує дохід бідних.

Статистичні показники

1.         Маємо дані про попит та пропозицію на ринку праці служби зайнятості у I півріччі 1998 та 1999 років за категоріями працівників та службовців.

Таблиця 8.

Категор працівників Середньоспискова кількість незайнятих громадян, тис. осіб Середньомісячна кількість вільних робочих місць та вакантних посад, тис. осіб
1998 1999 1998 1999

Гр. 1

Гр. 2

Гр. 3

Гр. 4

Гр.

Робітники 34,1 33,0 155,8 126,9
Службовці 21,3 20,8 9,6 13,2
Всього 55,4 53,8 165,4 140,1

Визначити:

a)         зміну чисельності незайнятих громадян та вільних робочих місць та вакантних посад за допомогою відносних і абсолютних показників динаміки;

b)         структуру попиту та пропозиції на ринку праці служби зайнятості та її зміни за допомогою абсолютних і відносних показників;

c)         показники координації для характеристики співвідношення попиту та пропозиції.

Обчисленні показники звести до окремих таблиць проаналізувати.

Розв’язання.

Величина абсолютного приросту за суміжні періоди чи моменти часу обчислюється за формулою: ,

де  - абсолютний приріст, уt - будь-який рівень ряду, починаючи з другого, уt-1 - рівень, що передує уt . Це ланцюгові абсолютні прирости.

Базисн абсолютні прирости - це прирости за період у цілому, вони визначаються за формулою:  ,    де - абсолютний приріст, yt - рівень ряду, y0 - значення показника, взяте за базисне. Базисні темпи росту:  ; ланцюгові темпи росту:  .

Відносні величини структури характеризують склад сукупності, х обчислюють діленням обсягу кожної частини сукупності на обсяг сукупності в цілому. Виражаються в коефіцієнтах або у відсотках. Зміни в структур характеризують структурні зрушення. Вони показують на скільки процентних пунктів змінилась частка певної частини сукупності в даному періоді порівняно з попереднім.

Відносні величини координації характеризують співвідношення частин досліджуваної сукупності, які показують, у скільки разів порівнювана частина сукупності більша або менша частини, що приймається за базу порівняння. Вибір бази порівняння довільний. В даному випадку ми розраховуємо скільки незайнятих громадян припадає на 100 вільних робочих місць.

Таблиця 9.

Категор працівників Середньоспискова кількість незайнятих громадян, тис. осіб Абсолютний приріст, тис. осіб Темп росту Структура незайнятих громадян, % до підсумку Структурні зрушення, п.п.
1998 1999

k

1998 1999

Гр. 1

Гр. 2

Гр. 3

Гр. 4 = гр. 3 – гр. 2

Гр. 5 =(гр. 3 : гр. 2 ) . 100

Гр. 6 =(гр. 2 : 55,4 ) . 100

Гр. 7 =(гр. 3 : 53,8 ) . 100

Гр. 8 =(гр. 7 : гр. 6 )

Робітники, ст. 1

34,1 33,0 -1,1 96,77 61,55 61,34 -0,21

Службовці, ст. 2

21,3 20,8 -0,5 97,65 38,45 38,66 0,21

Всього, ст. 3

55,4 53,8 -1,6 97,11 100,00 100,00 0,00

Таблиця 10.

Категор працівників Середньомісячна кількість вільних робочих місць та вакантних посад, тис. осіб Абсолютний приріст, тис. осіб Темп росту Структура середньомісячної кількості вільних робочих місць та вакантних посад, % до підсумку Структурні зрушення, п.п. Відносні величини координації, чисельність незайнятих громадян на 100 вільних робочих місць
1998 1999

k

1998 1999 1998 1999

Гр. 1

Гр. 2

Гр. 3

Гр. 4 = гр. 3 – гр. 2

Гр. 5 =(гр. 3 : гр. 2 ) . 100

Гр. 6 =(гр. 2 : 55,4 ) . 100

Гр. 7 =(гр. 3 : 53,8 ) . 100

Гр. 8 =(гр. 7 : гр. 6 )

Гр. 9

Гр. 10

Робітники, ст. 1

155,8 126,9 -28,9 81,45 94,20 90,58 -3,62 22 26

Службовці, ст. 2

9,6 13,2 3,6 137,50 5,80 9,42 3,62 222 158

Всього, ст. 3

165,4 140,1 -25,3 84,70 100,00 100,00 0,00 33 38

Гр. 9 =((ст. 1; 2; 3, гр. 2(таб. 9.)) : ((ст. 1; 2; 3, гр. 2(таб. 10))) . 100;  гр. 10 =((ст. 1; 2; 3, гр. 3(таб. 9.)) : ((ст. 1; 2; 3, гр. 3(таб. 10))) . 100. 

2. За трьома районами міста є наступні дані на кінець 2003 року:


Таблиця 11.

Район міста Кількість банків Середнє число вкладів Середній розмір вкладу, грн.

Гр. 1

Гр. 2

Гр. 3

Гр. 4

1 5 1500 400
2 6 1000 450
3 4 2000 500

Визначити в цілому по місту:

a)         середню кількість банків;

b)         середн число вкладів в банки;

c)         середній розмір вкладу;

d)         середню суму вкладів в банках.

Розв’язання.

В даному випадку середні значення показників обчислюватимемо за формулами середньо арифметичної. Для розв’язання задачі в кожному випадку починатимемо з логічно формули розрахунку середньої.

 

При розрахунку трьох останніх показників ми використали формулу середньо арифметичної зваженої. Для розрахунку середнього числа вкладів в банках в якості ваги ми використали кількість вкладів в одному банку.

4. Залишки обігових коштів на початок місяця становили тис. гр. од. :

січень ___________________1400; лютий___________________1550; березень___________________1270; квітень___________________1300.

Визначити середньомісячний залишок обігових коштів.

Розв’язання.

В цій задачі використаємо формулу середньої хронологічної, оскільки маємо показники моментні ( залишки обігових коштів на початок місяця ).

Середн значення моментного показника розраховується за формулою хронологічно середньої:

.

5. Податкова дисципліна підприємств різних видів діяльності характеризується даними:

Таблиці 12.

Вид діяльності Кількість підприємців, як сплачують податки
Всього, чол. % до всіх зареєстрованих
Виробнича 18 60
Торгівельна 28 70
Посередницька 44 55

Визначити у середньому за всіма видами діяльності частку підприємців, які сплачують податки.

Розв’язання. Запишемо логічну формулу:

Але ми не маємо даних щодо загальної чисельності підприємців. Тобто використати середню арифметичну ми не можемо. В цьому випадку потрібно застосувати формулу середньої гармонічної: або .

6. У таблиці наведений розподіл населення України за рівнем середньодушового сукупного доходу у 1998 р.

Таблиця 13.

Усе населення, млн. 50,3
У тому числі із середньодушовим доходом на місяць, грн.
До 30,0 0,6
30,1 – 60,0 7,3
60,1 – 90,0 14,2
90,1 – 120,0 12,0
120,1 – 150,0 7,0
150,1 – 180,0 3,9
180,1 – 210,0 2,3
210,1 – 240,0 1,1
240,1 – 270,0 0,8
270,1 – 300,0 0,4
Понад 300,0 0,7

Обчислити показники, що характеризують центр розподілу: середній рівень доходу, модальний та медіанний дохід.

Розв’язання.

Обчислення середньої арифметичної інтервального ряду розподілу:

1.      якщо варіаційний інтервальний ряд розподілу має відкриті інтервали, то, перш за все, х треба закрити за розмірами інтервалів, розташованих поруч.

2.      знаходимо середину інтервалів: до нижньої границі інтервалу додаємо верхню і ділимо на 2.

3.      знаходимо середню, використовуючи замість середньої величини за кожною групою середину нтервалу.


Таблиця 14.

Середина інтервалу Чисельність населення, млн. Сукупний дохід, млн. грн. Кумулятивна частота
15,05 0,6 9,03 0,6
45,05 7,3 328,865 7,9
75,05 14,2 1065,71 22,1
105,05 12 1260,6 34,1
135,05 7 945,35 41,1
165,05 3,9 643,695 45
195,05 2,3 448,615 47,3
225,05 1,1 247,555 48,4
255,05 0,8 204,04 49,2
285,05 0,4 114,02 49,6
315,05 0,7 220,535 50,3
Разом 50,3 5488 -

Середній рівень доходу:

Модальний дохід:

          Медіанний дохід:    

Модальний інтервал - ( 60,1 – 90,1 ), медіанний інтервал –

                        ( 90,1 – 120,1 ). Середньодушовий дохід складає 109,11 грн., переважна частина населення мала дохід на душу населення 82,77 грн., а половина  всього населення мала середньодушовий дохід менший 90,35 грн.

 Показники варіації

Кредитні ставки комерційних банків під короткострокові позики становили:

Таблиця 15.

Кредитна ставка, % Сума наданих кредитів, млн. гр. од.
I квартал II квартал

До 35

35 – 45

45 – 55

55 і більше

11

5

8

6

6

8

10

6

Разом 30 30

За кожний квартал визначити середню кредитну ставку, середн лінійне відхилення, дисперсію та середньоквадратичне відхилення.

Порівняти варіацію кредитної ставки комерційних банків в I та II кварталі.

Розв’язання.

Наведемо необхідні для розрахунку формули:

Середня арифметична  або  середнє лінійне відхилення  або   дисперсія   або  середньоквадратичне відхиленнякоефіцієнт варіації

Таблиця 16.

I квартал II квартал
Кредитна ставка, %

Сума наданих кредитів, млн. гр. од.

fi

Кредитна ставка, %

Середня кредитна ставка, %

xi

xifi

|xi –x |fi

(xi –x)2fi

Кредитна ставка, %

Сума наданих кредитів, млн. гр. од.

fi

Кредитна ставка, %

Середня кредитна ставка, %

xi

xifi

|xi –x |fi

(xi –x)2fi

Гр. 1

Гр. 2

Гр. 3

Гр. 4

Гр. 5 = гр. 2 . гр. 4

Гр. 6

Гр. 7

Гр. 8

Гр. 9

Гр. 10

Гр. 11

Гр. 12 = гр. 9 . гр. 11

Гр. 13

Гр. 14

До 35 11 25-35 30 330,00 143,00 1859,00 До 35 6 25-35 30 180,00 92,00 1410,67
35 – 45 5 35-45 40 200,00 15,00 45,00 35 – 45 8 35-45 40 320,00 42,67 227,56
45 – 55 8 45-55 50 400,00 56,00 392,00 45 – 55 10 45-55 50 500,00 46,67 217,78
55 і більше 6 55-65 60 360,00 102,00 1734,00 55 і більше 6 55-65 60 360,00 88,00 1290,67
Разом 30 - - 1290,00 316,00 4030,00 Разом 30 - - 1360,00 269,33 3146,67

I квартал:  

II квартал:  

Варіація кредитної ставки в II кварталі менша, оскільки значення коефіцієнта варіації в II кварталі менше.

Вибіркове спостереження

1. За результатами обстеження 100 зареєстрованих безробітних ( 2 % вибірка ), з яких 40 проходять перенавчання за новою професією, середня тривалість перерви в роботі становить 3 місяці, а дисперсія дорівнює 2,25. Визначити довірчий нтервал середньої тривалості перерви в роботі та частки безробітних, як проходять перенавчання за новою професією та відносні похибки цих показників.

 Розв’язання.

Визначимо меж середньої тривалості перерви в роботі з імовірністю 0,954 ( t = 2).

Гранична похибка , де  Довірчий інтервал  , тобто

Це дає підставу стверджувати з імовірністю 0,954, що середня тривалість перерви в робот становить не менш як 2,7 і не більш як 3,3 місяця.

Для того, щоб визначити граничну похибку частки безробітних, які перенавчаються, обчислимо дисперсію частки: σ2 = 0,4(1-0,4)=0,24. Частка р = 40 / 100 = 0,4.

Гранична похибка Довірчий інтервал

Отже, з такою самою імовірністю можна стверджувати, що частка безробітних, як перенавчаються, у генеральній сукупності становить не менше як 20,2 % і не більш як 39,8 %.

Відносна похибка середньої тривалості перерви в роботі

Відносна похибка частки безробітних, які перенавчаються, становить  Таким чином, відносна похибка частки більш ніж в два рази перевищує похибку середньої перерви в роботі.

2. На лісовому масиві в 400 га передбачається визначити  загальний запас деревини. Пробні площі становлять 0,1 га. За даними попередніх обстежень дисперсія виходу деревини з 0,1 га становила 9. Скільки пробних площ необхідно обстежити, щоб похибка вибірки з імовірністю 0,954 не перевищила 1 м3 ?

Розв’язання.

Всього на даному масиві 4000 ділянок. Достатній обсяг вибірки пробних ділянок визначимо, виразивши з формули граничної похибки невідомий показник:  

Методи аналізу взаємозв’язків

1. Маємо дані щодо кредитового обороту обласних філій банку та кількості їх клієнтів. Керівництво банку вважає, що між цими показниками снує певна залежність, і хоче знати, як функціонально кредитовий оборот філ залежить від кількості клієнтів банку.  Потрібно перевірити, чи лінійною залежність між даними показниками, побудувати модель лінійної парної регресії, яка б характеризувала дану залежність, а також:

Страницы: 1, 2


© 2010 Собрание рефератов