Применение показателей вариации для оценки формы распределения данных
На направление асимметрии указывает знак коэффициента: если As <О, то имеет место левосторонняя (отрицательная) асимметрия; если /4s> О, то имеет место правосторонняя (положительная) асимметрия. При этом если |/4s| < 0,5, то асимметрия считается несущественной. Центральный момент третьего порядка используется для характеристики асимметрии распределения. Если распределение асимметрично… Читать ещё >
Применение показателей вариации для оценки формы распределения данных (реферат, курсовая, диплом, контрольная)
Рассмотренные в гл. 6 показатели центральной тенденции и показатели вариации представляют собой частные случаи единой системы статистических характеристик распределения. Такая единая система характеристик может быть представлена моментами статистического распределения, которые применяются для анализа формы распределения данных. Система моментов распределения была разработана русским математиком П. Л. Чебышевым.
Общая формула центральных моментов k-vo порядка имеет вид[1]
2. Центральный момент первого порядка всегда равен нулю:
3. Центральный момент второго порядка представляет собой дисперсию данного распределения:
4. Центральный момент третьего порядка равен нулю, если распределение симметричное, так как отрицательные отклонения в левой ветви распределения будут уравновешиваться положительными отклонениями в правой части:
Центральный момент третьего порядка используется для характеристики асимметрии распределения. Если распределение асимметрично, то отрицательные отклонения в левой ветви распределения не будут равны положительным отклонениям в правой части.
Чтобы придать показателю безразмерный характер, сделать его сравнимым для разных совокупностей, используют моментный коэффициент асимметрии, который определяется, но формуле.
На направление асимметрии указывает знак коэффициента: если As < О, то имеет место левосторонняя (отрицательная) асимметрия; если /4s > О, то имеет место правосторонняя (положительная) асимметрия. При этом если |/4s| < 0,5, то асимметрия считается несущественной.
Основной недостаток моментного коэффициента асимметрии заключается в том, что его величина зависит от наличия в совокупности резко выделяющихся единиц. Для таких совокупностей этот коэффициент малопригоден, так как его большая (абсолютная) величина будет объясняться доминирующим вкладом в величину центрального момента третьего порядка нетипичных значений, а не асимметричностью распределения основной части единиц. В таких случаях рекомендуют либо исключить из анализа резко отличающиеся единицы, либо использовать структурные показатели асимметрии.
Структурные показатели (коэффициенты) асимметрии характеризуют асимметричность только в центральной части распределения, т. е. основной массы единиц, и в отличие от моментного коэффициента не зависят от крайних значений признака.
Наиболее часто применяют структурный коэффициент асимметрии К. Пирсона:
Из данной формулы следует правило определения формы распределения данных с помощью характеристик центральной тенденции ряда.
5. Центральный момент четвертого порядка:
На основе центрального момента четвертого порядка определяется другая характеристика формы ряда распределения данных — эксцесс.
Эксцесс (от лат. excessus — отступление, излишество) — это отклонение вершины данного распределения вверх или вниз от вершины кривой нормального распределения.
Как правило, эксцесс определяется только для симметричных или умеренно симметричных распределений по формуле.
Для нормального распределения данных Ех — 0, так как —г = 3. Распре;
деление более островершинное, чем нормальное, обладает положительным эксцессом (Ех > 0), а более плосковершинное — отрицательным (Ех < 0) (рис. 7.2).
Рис. 7.2. Формы распределения данных при положительном и отрицательном эксцессах
Типовая задача 7.1.
По данным табл. 7.2 определите показатели вариации и показатели относительного рассеивания. Сделайте вывод о форме распределения данных, определив коэффициенты асимметрии и эксцесса.
Таблица 7.2
Распределение рабочих по выполнению норм выработки
Выполнение нормы, % | Численность рабочих, человек. |
80−90. | |
90−100. | |
100−110. | |
110−120. | |
120 и более. |
Решение
- 1. Определим размах вариации: R = xmax — xmin = 125 — 85 = 40%.
- 2. Определим среднее линейное отклонение, рассчитав сначала среднее значение признака. Промежуточные расчеты представим в табл. 7.3.
Таблица 7.3
Вспомогательная таблица для промежуточных расчетов
Выполнение нормы, %. | Численность рабочих /, человек. | X | х/ | х — х | |х-х|-/. | (х-х)2 | (х — х)2 • /. |
80−90. | |||||||
90−100. | |||||||
100−110. | |||||||
110−120. | |||||||
120 и более. | |||||||
Итого. | ; | 10 760. | ; | ; | 11 740. |
Выполнение нормы рабочими отклоняется от среднего значения на 9%.
3. Рассчитаем дисперсию и среднее квадратическое отклонение. Промежуточные данные приведены также в табл. 7.3.
Можно утверждать, что в среднем выполнение норм выработки рабочими предприятия отличается от среднего выполнения нормы 108% на ±11%.
4. Определим коэффициент осцилляции:
т.е. среднее значение отклоняется от крайних значений признака на 37%.
5. Рассчитаем относительное отклонение:
т.е. абсолютное отклонение значений признака от средней величины составляет 8%.
6. Оценим однородность совокупности с помощью коэффициента вариации:
Поскольку Va < 33%, то данная совокупность считается однородной.
7. Оценим форму распределения данных с помощью коэффициентов асимметрии и эксцесса.
Рассчитаем структурный коэффициент асимметрии К. Пирсона:
Для этого вычислим моду ряда распределения рабочих по выполнению норм выработки:
т.е. большинство рабочих выполняет нормы выработки на 106%.
Подставим имеющиеся данные в формулу расчета коэффициента асимметрии:
Так как 0 < As < 0,5, то имеет место несущественная правосторонняя (положительная) асимметрия.
Определим показатель эксцесса по формуле
Промежуточные расчеты представим в табл. 7.4.
Таблица 7.4
Вспомогательная таблица для промежуточных расчетов
Выполнение нормы, %. | Численность рабочих /, человек. | X | (х — Л')4 | (.г — х)4 • /. |
80−90. | 289 841. | 1 449 205. | ||
90−100. | 28 561. | 542 659. | ||
100−110. | ||||
110−120. | 60 025. | |||
120 и более. | 83 521. | 1 252 815. | ||
Итого. | 3 307 620. |
Рассчитаем центральный момент четвертого порядка:
Подставим полученные данные в формулу расчета эксцесса:
Поскольку Ех < 0, то распределение исходных данных — плосковершинное, т. е. скачок считается незначительным.
- [1] Центральный момент нулевого порядка всегда равен единице: