рефераты бесплатно

МЕНЮ


Статистика

верно избран вид средней. Расчет средних, выполненных на основе одних и тех

же данных разными способами дает различные результаты.

В курсе математической статистики доказано, что чем ниже степень

средней, тем меньше ее величина. Это называется правилом мажорантности

средней.

|k |-1 |0 |1 |2 |

|[p|[pi|<|[pi|<|[p|<|[pi|

|ic|c] | |c] | |ic| |c] |

|] | | | | |] | | |

Доказано так же, что чем интенсивней колеблются значения вариантов

ряда, тем больше разница между ними.

6. Мода и процентили.

Наряду со средними для характеристики распределения применяют такие

показатели как мода и процентили, которые дополняют характеристику

(обобщающую) и позволяют сравнивать между собой и находить различия в рядах

с одинаковыми средними.

Мода – это наиболее часто встречающийся вариант ряда.

В дискретных рядах распределения модой является вариант, имеющий

максимальную частотную характеристику.

В интервальных рядах мода определяется в два этапа. В начале

определяется интервал, содержащий моду (модальный интервал), а затем

рассчитывается значение моды по формуле:

[pic], где [pic] - нижняя граница модального интервала, i – величина

этого интервала, [pic], [pic], [pic] - частоты модального, предшествующего

ему и следующего за ним интервалов.

Для последней таблицы (данные о выработке рабочих токарей):

[pic]

Медиана (вид процентиля), который занимает серединное положение в ряду

распределения. Медиана определяется по формуле:

[pic], где [pic] - нижняя граница интервала, содержащего медиану

(интервал определяется по накопленной частоте, первой превышающей 50% суммы

частот (в дальнейшем для квартилей, децилей – 25%, 75%, 0,1%, 0,2% и

т.д.)), i – величина этого интервала, [pic] - номер медианы, [pic] -

накопленная частота интервала, предшествующего медиане, [pic] - частота

медианного интервала.

Поскольку медиана разновидность процентиля то данная формула носит

универсальный характер, она может применяться для определения квартилей (Q)

и децилей (d).

Квартили (четверти) отсекают от совокупности соответственно 25%, 50% и

75%.

Децили отсекают от совокупности соответственно 10%, 20%, 30% и т.д.

На первом этапе определяется номер процентиля по формуле:

[pic] - для ряда четным числом единиц;

[pic] - с нечетным числом единиц.

[pic] - номер процентиля (порядковый), [pic] - индекс процентиля

(выражается десятичной дробью) ([pic]), N – численность совокупности.

Расчет моды и процентилей

на примере группировки магазинов по сумме товарооборота.

|Группы магазинов |Число |Накопленная |

|с торговой площадью, |магазинов,|частота, |

| | |[pic] |

|кв. м |[pic] | |

|До 100 |6 |6 |

|100-200 |12 |18 |

|200-300 |27 |45 |

|300-400 |13 |58 |

|400-500 |8 |66 |

|Свыше 500 |5 |71 |

|Итого |71 | |

Накопленная частота – это сумма частот данного и всех предшествующих

ему интервалов.

[pic]

[pic]

Четверть всех магазинов имеет площадь менее 200 кв. метров, а остальные

75% более 200 кв. метров.

[pic]

Три четверти магазинов имеют торговые площади не превышающие 369,2 кв.

метров, остальные больше.

[pic]

Показатели вариации.

1. Понятие вариации и роль ее изучения в статистических исследованиях.

2. Измерители вариации.

3. Прямой способ расчета показателей вариации.

4. Свойства дисперсии и среднего квадратического отклонения.

5. Упрощенный способ расчета дисперсии и средне квадратического

отклонения.

6. Относительные показатели вариации.

7. Стандартизация данных.

8. Моменты распределения.

9. Показатели асимметрии и эксцесса.

10. Средняя арифметическая и дисперсия альтернативного признака.

1. Понятие вариации и роль ее изучения в статистических исследованиях.

Вариация – это колеблемость значений признака у отдельных единиц

совокупности.

Наличию вариации обязана своим появлением статистика. Большинство

статистических закономерностей проявляется через вариацию. Изучая вариацию

значений признака в сочетании с его частотными характеристиками, мы

обнаруживаем закономерности распределения (например: население по возрасту,

студентов по уровню оценок).

Рассматривая вариацию одного признака параллельно с изменением другого,

мы обнаруживаем взаимосвязи между этими признаками или их отсутствие

(например: зависимость между торговой площадью и товарооборотом).

Вариации в статистике проявляются двояко, либо через изменения значений

признака у отдельных единиц совокупности, либо через наличие или отсутствие

изучаемого признака у отдельных единиц совокупности.

Изучение вариации в статистике имеет как самостоятельную цель, так и

является промежуточным этапом более сложных статистических исследований.

2. Измерители вариации.

Простейшим показателем вариации является размах колебаний: [pic].

Достоинство этого показателя простота расчета, возможность

использования для оценки вариации однородных совокупностей. Недостаток –

неприемлемость для неоднородных совокупностей с редкими выбросами крайних

значений признака.

Частично недостатки этого показателя устраняет межквартельный размах:

[pic]. Однако, он характеризует вариацию только половины совокупности.

Для учета колеблемости всех значений признака применяют показатели

среднего линейного отклонения, дисперсии и средне квадратического

отклонения.

Средне линейное отклонение – среднее значение отклонений всех вариантов

ряда от средней арифметической (иногда от моды или медианы):

[pic] - для несгруппированных данных;

[pic] - для сгруппированных данных.

[pic] [pic]

Аналогичным по смыслу среднему линейному отклонению является показатель

дисперсии и рассчитываемый на его основе показатель средне квадратического

отклонения.

Дисперсия – рассеивание, данный показатель характеризует рассеивание

значений признака относительно его средней величины.

[pic] - для несгруппированных данных;

[pic] - для сгруппированных данных.

Дисперсия – средне квадратическое отклонение всех вариантов ряда от

средней арифметической. Если извлечь квадратный корень из дисперсии,

получим средне квадратическое отклонение.

[pic] - для несгруппированных данных;

[pic] - для сгруппированных данных.

Несмотря на логическое сходство, дисперсия является более

чувствительной к вариации и, следовательно, чаще применяемый показатель.

3. Прямой способ расчета показателей вариации.

Расчет показателей вариации заработной платы работников завода.

|750 |30 |- 1 500 |-1 |2 |-2 |2 |

|2 250 |75 |0 |0 |5 |0 |0 |

|3 750 |45 |1 500 |1 |3 |3 |3 |

|5 250 |15 |3 000 |2 |1 |2 |4 |

|Итого | | | |11 |3 |9 |

А=2250; k=1500; с=15

[pic]

6. Относительные показатели вариации.

Абсолютные измерители вариации (дисперсия, средне квадратическое

отклонение) ограниченно пригодны для сравнительного анализа вариаций

различных совокупностей.

Для цели сравнительного анализа применяют относительные показатели,

коэффициенты вариации. Наиболее распространенной формой коэффициентов

вариации является [pic], он показывает, какой процент от средней

арифметической составляет среднее квадратическое отклонение.

Вместо средне квадратического в числителе коэффициента вариации иногда

используют среднее линейное отклонение [pic].

Если среднее линейное отклонение определялось относительно медианы или

моды, то соответствующие показатели вариации будут выглядеть [pic], [pic].

Коэффициенты вариации определенные по различным основаниям не

одинаковы, поэтому, сопоставляя вариации разных совокупностей, нужно

использовать коэффициенты вариации, рассчитанные по одной и той же

величине.

Коэффициент вариации является так же количественной мерой однородности

совокупности. Принято считать, что если [pic], то совокупность

количественно однородна. Чем меньше, тем лучше.

7. Стандартизация данных.

Коэффициенты вариации являются сводными оценками вариаций различных

совокупностей. Однако они не позволяют сопоставить между собой значения

признака у отдельных или групп единиц разных совокупностей.

Для подобных сравнений прибегают к стандартизации вариантов разных

совокупностей по формулам:

[pic], где [pic], [pic] - это стандартизированные значения вариантов

ряда x и y соответственно. В процессе стандартизации мы переходим от

измерения вариантов в натуральных или стоимостных единицах к их измерению

величинами соответствующих средне квадратических отклонений.

Пример: Стандартизация данных о доходах на одного члена семьи и

среднедушевом потреблении мяса.

|Доход на |Среднедушевое |[pic]|[pic]|[pic] |[pic] |[pic]|[pic] |

|одного |потребление | | | | | | |

|члена семьи, |мяса, [pic] | | | | | | |

|тыс. | | | | | | | |

|руб./год, | | | | | | | |

|[pic] | | | | | | | |

|60,7 |12,3 |-97,5|-25,6|9 506,25 |655,36 |-1,28|-1,31 |

|84,2 |19,1 |-74 |-18,8|5 476,00 |353,44 |-0,97|-0,96 |

|112,4 |23,1 |-45,8|-14,8|2 097,64 |219,04 |-0,60|-0,76 |

|144,5 |35,6 |-13,7|-2,3 |187,69 |5,29 |-0,18|-0,12 |

|180,1 |49,5 |21,9 |11,6 |479,61 |134,56 |0,29 |0,59 |

|240,9 |57,3 |82,7 |19,4 |6 839,29 |376,36 |1,09 |0,99 |

|284,6 |68,4 |126,4|30,5 |15 976,96|930,25 |1,66 |1,56 |

|1107,4 |265,3 | | |40 563,44|2 674,30 | | |

[pic]

[pic]

При стандартизации сгруппированных данных наряду с масштабированием

вариантов ряда величинами соответствующих средне квадратических отклонений

частоты этих рядов пересчитываются в частости.

Стандартизацию данных проводят, когда варианты сравниваемых рядов

отличаются единицами измерения и порядком.

Стандартизация является важнейшим статистическим промежуточным этапом.

Стандартизация используется так же хорошо в теории выборочного метода.

8. Моменты распределения.

Моменты распределения составляют алгоритмическую основу многих

статистических методов. Различают:

. Произвольные (общий случай);

. Начальные;

. Центральные;

. Стандартные (частный случай).

Выделяют:

- Взвешенные;

- Невзвешенные.

Произвольным моментом k-го порядка называется среднее значение k-ой

степени отклонения всех вариантов ряда от произвольного постоянного числа.

[pic] - для несгруппированных данных;

[pic] - для сгруппированных данных.

При этом k принимает целочисленное значение от 1 до 4.

Если А=0, то произвольный момент преобразуется в начальный момент.

[pic] - для несгруппированных данных;

при k=1 M1=[pic]

при k=2 M2=[pic]

[pic] - для сгруппированных данных.

Если А=[pic], произвольный момент преобразуется в центральный момент

распределения.

[pic] - для несгруппированных данных;

[pic] - для сгруппированных данных.

При k=1 M1=0

При k=2 M2=[pic]

Стандартные моменты это начальные моменты из стандартных отклонений.

[pic] - для несгруппированных данных;

[pic] - для сгруппированных данных.

[pic]

Стандартный момент k-го порядка это отношение центрального момента того

же порядка к средне квадратическому отклонению в k-ой степени.

Так же как средняя арифметическая величина и дисперсия, центральные и

стандартные моменты обладают рядом свойств, которые по сути ближе всего к

свойствам дисперсии.

9. Показатели асимметрии и эксцесса.

При анализе распределений помимо графического изображения характер

распределения можно выяснить, рассчитывая такие показатели, как асимметрия

и эксцесс.

В качестве показателя асимметрии используют стандартный момент 3-го

порядка. Если распределение симметрично относительно средней то показатель

асимметрии равен нулю.

[pic] [pic]

Если показатель асимметрии больше 0, то есть преобладают положительные

отклонения от среднего, то наблюдается правосторонняя асимметрия, то есть

преобладание в совокупности вариантов ряда превышающих среднюю.

Если же показатель асимметрии меньше 0, налицо левосторонняя

асимметрия, то есть превышение численности вариантов ряда меньше чем

средняя.

Показатель эксцесса характеризует степень колеблемости исходных данных,

чем сильнее вариация, тем более пологой является кривая распределения и

наоборот, чем однороднее совокупность, тем в большей степени варианты ряда

сконцентрированы около средней и тем более островершинней будет кривая

распределения.

В качестве эталона высоты распределения в статистике принимается кривая

нормального распределения. Доказано, что стандартный момент 4-го порядка у

этой кривой равен 3.

[pic] [pic]

10. Средняя арифметическая и дисперсия альтернативного признака.

Альтернативный признак – тот которым обладает или не обладает единица

совокупности.

Наличие альтернативного признака обозначают 1, а отсутствие – 0. Если

численность совокупности – N, а M – число единиц, обладающих изучаемым

признаком, то [pic] - доля единиц, обладающих изучаемым признаком.

Соответственно [pic] - доля единиц таким признаком не обладающих.

Предположим

|[pi|[pi|

|c] |c] |

|1 |p |

|0 |q |

| |1 |

p+q=1

[pic]

Средняя арифметическая альтернативного признака равна p.

[pic]

Дисперсия альтернативного признака [pic].

Пример: N=10, M=4

N-M=6

[pic]

Максимальное значение дисперсии для неоднородных совокупностей [pic].

Выборочный метод.

1. Сущность выборочного метода и его практическое значение.

2. Ошибка выборки.

3. Малая выборка.

4. Определение оптимальной численности выборки.

5. Распространение результатов выборочного распределения на генеральную

совокупность.

6. Классификация способов отбора.

7. Организация отбора различными способами и оценка надежности

полученных результатов.

8. Моментное выборочное наблюдение.

1. Сущность выборочного метода и его практическое значение.

Выборочный метод – это основной способ сбора информации в условиях

развитой рыночной экономики.

Выборка – разновидность несплошного наблюдения, позволяющего определить

показатели всей совокупности (генеральной совокупности) на основе изучения

ее части. При этом отобранная часть формируется с учетом положений теории

вероятности и математической статистики.

Выборка имеет многовековую историю, но ее математическая составляющая

получила развитие во 2й половине 19-20 века. Значительный вклад в

формирование теории выборки внесли русские статистики. В СССР

господствовало сплошное статистическое наблюдение в виде отчетности.

Выборка охватывала только:

. Оценку качества продукции;

. Наблюдение за ценами на городских колхозных рынках;

. Наблюдение за семейными бюджетами;

. Изучение спроса.

За рубежом в то время преобладало выборочное обследование. Сплошное

наблюдение охватывало только таможенную статистику, налогообложение и

периодически проводимые переписи населения, и промышленные цензы.

Достоинства выборки.

При правильно организованном выборочном обследовании изучается не более

20-25% совокупности, обычно 10% и то много. На лицо огромная экономия

времени и средств. При этом благодаря работе статистиков – профессионалов

значительно повышается точность наблюдений (нередко она выше, чем при

сплошном наблюдении). Однако, параметры выборки в силу объективных причин

могут отличаться от соответствующих параметров генеральной совокупности,

поэтому результаты выборочного исследования распространяются на генеральную

совокупность с определенной вероятностью.

Не всякое несплошное наблюдение – это научно-обоснованная выборка.

Для получения надежных результатов необходимо тщательно готовить

выборку. Подготовка включает следующие этапы:

1. Обоснование целесообразности проведения выборки;

2. Подготовка программы выборки;

3. Решение организационных вопросов выборки;

4. Определение способа отбора и численности выборки, обеспечивающих

репрезультативность ее результатов.

5. Проведение отбора единиц генеральной совокупности.

6. Сводка полученных результатов и расчет параметров выборки.

7. Определение ошибок выборки.

8. Распространение параметров выборки на генеральную совокупность.

Страницы: 1, 2, 3, 4, 5, 6, 7


Copyright © 2012 г.
При использовании материалов - ссылка на сайт обязательна.