рефераты бесплатно

МЕНЮ


Статистическая обработка и статистический анализ данных

Статистическая обработка и статистический анализ данных

Министерство образования Российской Федерации

Южно-Уральский государственный университет

Кафедра Экономики и финансов

Статистическая обработка и статистический анализ данных

по материалам реального статистического наблюдения

Пояснительная записка к курсовому проекту

по курсу статистики

Руководитель

Лазарева

Галина Владимировна

« » 200- г.

Автор проекта

« » 200- г.

Проект защищен с

оценкой о

. .

« » 200- г.

Челябинск

200-

Содержание

Введение…………………………………………………………………………………….3

1. Сводка и группировка данных статистического наблюдения……………...…………...4

2. Вариационный анализ……………………………………………………………………...8

3. Моделирование ряда распределения………………………………………………….….10

4. Корреляционный анализ…………………………………………………………………..11

5. Выборочное наблюдение…………………………………………………………………..14

6. Анализ динамики…………………………………………………………………………..16

Заключение……………………………………………………………………………………18

Литература……………………………………………………………………………….……19

Приложения…………………………………………………………………………………………20

Введение

В данной работе представлена статистическая обработка и статистический

анализ данных по материалам реального статистического наблюдения над

численностью населения в возрасте моложе трудоспособного на 1.01.2002, чел.

Актуальность проводимого исследования ярко проявляется в свете

современной социально-экономической и демографической ситуации в нашей

стране, когда вот уже на протяжении нескольких последних лет наблюдается

отрицательный естественный прирост (естественная убыль) населения. Проблема

снижения рождаемости и старения населения является характерной не только

для России, но и для многих других развитых стран запада.

Владение методами статистики дает возможность превращать безликую и

разрозненную массу числовых данных в стройную систему знаний, основываясь

на которых можно принимать эффективные управленческие решения.

Цель курсового проекта – освоить инструменты статистики для дальнейшего

применения в решении управленческих задач.

Можно выделить следующие задачи данного курсового проекта:

- приобрести навыки работы с большими массивами данных и навыки

представления данных статистического наблюдения в виде, удобном для

восприятия, анализа и принятия решений;

- освоить методы выполнения оценок параметров больших множеств по данным

выборочного наблюдения;

- развить аналитические навыки в ходе применения вариационного и

корреляционного методов и интерпретации полученных результатов.

Таким образом, проводимый статистический анализ позволит сделать выводы

о характеристиках исследуемого показателях и тенденциях его развития.

1. Сводка и группировка данных статистического наблюдения

Результаты статистического наблюдения регионов РФ по показателю

"Численность населения в возрасте моложе трудоспособного на 1.01.2002 г.,

чел." представим в виде простой сводки, т.е. в единый документ без какого-

либо ранжирования или разделения на группы. (Таблица 1.1)

Таблица 1.1- Численность населения в возрасте моложе трудоспособного на

1.01.2002 г., чел.

|Регион |Численность населения в возрасте моложе |

| |трудоспособного на 1.01.2002 г., чел. |

|Белгородская область |272081 |

|Брянская область |258812 |

|Владимирская область |260718 |

|Воронежская область |408451 |

|Ивановская область |190699 |

|Калужская область |177752 |

|Костромская область |135393 |

|Курская область |224612 |

|Липецкая область |212032 |

|Московская область |990986 |

|Орловская область |152332 |

|Рязанская область |204469 |

|Смоленская область |184672 |

|Тамбовская область |212447 |

|Тверская область |256525 |

|Тульская область |261924 |

|Ярославская область |221876 |

|г. Москва |1348893 |

|Республика Карелия |137425 |

|Республика Коми |214022 |

|Архангельская область |265673 |

|Вологодская область |239365 |

|Калининградская область |165465 |

|Ленинградская область |268037 |

|Мурманская область |164789 |

|Новгородская область |121690 |

|Псковская область |131185 |

|г. Санкт-Петербург |681209 |

|Республика Адыгея | 86616 |

|Республика Дагестан |685577 |

|Республика Ингушетия |138822 |

|Кабардино-Балкарская |193530 |

|Республика | |

|Республика Калмыкия | 77289 |

|Карачаево-Черкесская | 97987 |

|Республика | |

|Республика Северная |142074 |

|Осетия-Алания | |

|Чеченская Республика |199841 |

|Краснодарский край |947077 |

|Ставропольский край |524337 |

|Астраханская область |203780 |

|Волгоградская область |475016 |

|Ростовская область |760726 |

|Республика Башкортостан |888812 |

|Республика Марий Эл |152830 |

|Республика Мордовия |164596 |

|Республика Татарстан |769340 |

|Удмуртская Республика |326297 |

|Чувашская Республика |275529 |

|Кировская область |272759 |

|Нижегородская область |600910 |

|Оренбургская область |450187 |

|Пензенская область |257616 |

|Пермская область |563021 |

|Самарская область |564441 |

|Саратовская область |478167 |

|Ульяновская область |265331 |

|Курганская область |209522 |

|Свердловская область |808090 |

|Тюменская область |693732 |

|Челябинская область |674104 |

|Республика Алтай | 53706 |

|Республика Бурятия |235795 |

|Республика Тыва | 97443 |

|Республика Хакасия |116575 |

|Алтайский край |479633 |

|Красноярский край |592171 |

|Иркутская область |572401 |

|Кемеровская область |540088 |

|Новосибирская область |480946 |

|Омская область |415839 |

|Томская область |194853 |

|Читинская область |279006 |

|Республика Саха (Якутия) |253905 |

|Приморский край |388798 |

|Хабаровский край |279700 |

|Амурская область |198256 |

|Камчатская область | 69028 |

|Магаданская область | 40710 |

|Сахалинская область |109353 |

|Еврейская авт. область | 41034 |

|Чукотский авт. округ | 14577 |

Построим две простые группировки регионов Российской Федерации по

данному показателю.

В первой группировке выделим группы регионов со значением показателя

ниже и выше среднего по Российской Федерации. Для этого найдем среднее

значение данного показателя по РФ. Так как показатель "Численность

населения в возрасте моложе трудоспособного на 1.01.2002 г., чел." является

абсолютным, его среднее значение будем искать по формуле средней

арифметической простой. Получим среднее значение:

? Х i

n

Результаты простой группировки представлены в Таблице 1.2

Таблица 1.2 - Простая группировка с выделением групп регионов со

значением показателя ниже и выше среднего по РФ

| |Количество регионов |Среднее значение |

| | |показателя в группе, чел.|

|Регионы со значением |54 |184858 |

|показателя ниже среднего по| | |

|РФ | | |

|Регионы со значением |26 |645498 |

|показателя выше среднего по| | |

|РФ | | |

Для наглядности представим данную группировку в виде диаграммы.

Диаграмма 1.1 - Простая группировка с выделением групп регионов со

значением показателя ниже и выше среднего по РФ

Т.к. данный показатель является абсолютным, то мы не можем сравнивать

значения показателей по регионам, вследствие их зависимости от размера

территории и общего количества населения. Для возможности такого сравнения

построим вторую простую группировку, в которой выделим группы регионов со

значением показателя "Доля населения в возрасте моложе трудоспособного на

1.01.2002 г., %" ниже и выше среднего по Российской Федерации. Расчет

значений этого показателя по регионам и среднего значения представлен в

Приложении А (Российский статистический ежегодник 2002 (стр. 90, таблица

5.9))

Результаты простой группировки представлены в Таблице 1.3

Таблица 1.3 - Простая группировка с выделением групп регионов со

значением показателя "Доля населения в возрасте моложе

трудоспособного на 1.01.2002 г., %" ниже и выше среднего по

РФ

| |Количество регионов |Среднее значение |

| | |показателя в группе, % |

|Регионы со значением |44 |17,3 |

|показателя ниже среднего по| | |

|РФ | | |

|Регионы со значением |36 |22,1 |

|показателя выше среднего по| | |

|РФ | | |

Для наглядности сопроводим группировки графиками:

Диаграмма 1.2 - Простая группировка с выделением групп регионов со

значением показателя "Доля населения в возрасте моложе

трудоспособного на 1.01.2002 г., %" ниже и выше среднего

по РФ

Таким образом, если сопоставить абсолютные значения показателя

"Численность населения в возрасте моложе трудоспособного на 1.01.2002 г.,

чел." по регионам со средним значением по РФ, то значительно большее

количество регионов характеризуется значением показателя ниже среднего по

РФ (54 региона против 26). Но если использовать относительный показатель

"Доля населения в возрасте моложе трудоспособного на 1.01.2002 г., %",

дающий возможность сравнения, то можно увидеть, что число регионов со

значением показателя ниже среднего по РФ приближается к числу регионов со

значением показателя выше среднего по РФ (44 и 36 регионов соответственно).

2. Вариационный анализ

Первый этап вариационного анализа - построение вариационного ряда. На

этом этапе важно правильно определить, ряд какого вида целесообразно

построить. Т.к. изучаемый признак – чмсленность населения в возрасте моложе

трудоспособного – относится к непрерывному виду, то строим интервальный

вариационный ряд. Для построения вариационного ряда определим количество

интервалов в ряду и длину интервала. Воспользуемся формулой Стержесса:

Количество интервалов k = 1 + 3,32 * lg80 = 7,3.

В качестве длины интервала l выберем целочисленное и удобное для

восприятия значение в интервале от l2 до l1:

l1 = (1348893-14577)/7 = 190617

l2 = (1348893-14577)/8 = 166790

Получим вариационный ряд, состоящий из 7 интервалов длиной 180000.

(Таблица 2.1).

Таблица 2.1 - Вариационный ряд

|Численность |Менее |180-360|360-540|540-720|720-90|900-108|Более |

|населения в |180 | | | |0 |0 |1080 |

|возрасте моложе | | | | | | | |

|трудоспособного на | | | | | | | |

|1.01.2002 г., тыс. | | | | | | | |

|чел. | | | | | | | |

|Число регионов |23 |31 |9 |10 |4 |2 |1 |

Графически интервальный вариационный ряд изображается гистограммой:

Диаграмма 2.1 - Вариационный ряд

Второй этап вариационного анализа - расчет показателей вариации

(Приложение Б). Оформим его в виде таблицы:

Таблица 2.2 - Показатели вариации

|Показатель |Значение |Качественная оценка |

|Среднее |339750 |На 1.01.2002 средняя численность населения в |

|значение | |возрасте моложе трудоспособного по регионам РФ |

| | |составляла 339750 чел. |

|Показатели структуры вариации |

|Мода |228000 |Наиболее часто встречающееся значение численности |

| | |населения в возрасте моложе трудоспособного |

| | |составляет около 228000 чел. |

|Медиана |278710 |40 регионов РФ характеризуется численностью |

| | |населения в возрасте моложе трудоспособного ниже |

| | |278710 чел. и 40 регионов выше |

|Показатели силы и интенсивности вариации |

|Размах |976409 |Даже исключив из совокупности регион с аномальным |

|вариации | |значением показателя (г. Москва - 1348893 чел.), |

| | |найдем, что абсолютный разброс значений признака |

| | |чрезвычайно высок. |

|Среднее |197663 |Значения численности населения в возрасте моложе |

|линейное | |трудоспособного по регионам на 1.01.2002 |

|отклонение | |отличались в среднем на 197663 чел. от среднего |

Страницы: 1, 2


Copyright © 2012 г.
При использовании материалов - ссылка на сайт обязательна.