Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Ряды распределения. 
Теория статистики с элементами эконометрики в 2 ч. Часть 1

РефератПомощь в написанииУзнать стоимостьмоей работы

Для детального изучения частотных изменений внутри ряда распределения составляется ряд накопленных частот (кумулятивный ряд) — ряд, показывающий количество случаев выше или ниже определенного уровня. Накопленные частоты находятся посредством последовательного прибавления к частотам первой группы частот последующих групп. Последнее значение кумулятивного ряда совпадает с объемом распределения… Читать ещё >

Ряды распределения. Теория статистики с элементами эконометрики в 2 ч. Часть 1 (реферат, курсовая, диплом, контрольная)

Отдельным видом статистической группировки является ряд распределения — упорядоченное распределение единиц совокупности на группы по определенному признаку. Область его применения — анализ состава и структуры изучаемой совокупности, степени се однородности и пределов изменения, закономерностей развития наблюдаемого объекта в целом. Составными частями ряда распределения выступают варианта — группа по выделенному признаку — и вес — численность группы. Вес в свою очередь может быть разделен на частоты — численности группы, выраженные в абсолютных величинах, и частости — численности группы, характеризуемые относительными значениями (долями единицы, процентами, промиллями, продецимиллями). Сумма всех частот либо частостей называется объемом распределения или численностью распределения. Объем распределения равен единице, если частости представлены в долях, и равен 100%, если частости выражены в процентах. На практике к относительным показателям обычно обращаются для отображения масштабных совокупностей; кроме того, они обладают дополнительным преимуществом перед абсолютными, а именно, позволяют производить сопоставление по одному и тому же признаку различных по объему распределений. Общая схема построения ряда распределения такова: варианты обозначаются через переменную величину xjt каждому из этих значений соответствует вес — частота /, или частость «т (рис. 3.8).

Как вид статистической группировки ряд распределения основывается на качественном либо количественном признаке. В первом случае ряд называется атрибутивным, во втором — вариационным. Количественный признак может быть прерывным или непрерывным; в связи с этим вариационные ряды подразделяются на дискретные и интервальные (рис. 3.9). Выбор типа распределения зависит от характера груипировочного признака:

Схема статистического ряда распределения.

Рис. 3.8. Схема статистического ряда распределения.

Классификация видов статистического ряда распределения.

Рис. 3.9. Классификация видов статистического ряда распределения.

в случаях, когда вариация непрерывна и проявляется в достаточно широких пределах, то целесообразно прибегнуть к интервальному ряду; напротив, если общее количество вариантов признака невелико (не превышает 10), предпочтительным оказывается дискретный ряд. Техника построения рядов распределения аналогична принципам создания группировок. Примером атрибутивного ряда могут служить данные табл. 3.6, дискретного — табл. 3.7, интервального — табл. 3.8.

В случаях, когда интервальный вариационный ряд распределения имеет равные интервалы, вес позволяет судить о степени заполняемости всех групп единицами наблюдения. Однако если группировка осуществлена по неравным интервалам, то веса Распределение инвестиций по группам нефинансовых активов в Российской Федерации за 2000—2012 гг. (в фактически действовавших ценах)[1]

Группы нефинансовых активов.

Млрд руб.

% к итогу.

Год.

Год.

А.

Инвестиции в основной капитал.

1053,7.

8768,4.

98,4.

98,3.

Инвестиции в объекты интеллектуальной собственности.

15,9.

48,0.

1,5.

0,5.

Инвестиции в другие нефинансовые активы.

1,6.

52,5.

ОД.

0,6.

Затраты на научно-исследовательские, опытно-конструкторские и технологические работы.

—.

53,3.

—.

0,6.

Всего инвестиций в нефинансовые активы.

1071,2.

8922,2.

100,0.

100,0.

Таблица 3.7

Распределение численности аспирантов по возрастным группам (от 23 до 29 лет) в Российской Федерации в 2012 г.

Группы аспирантов по возрасту, лет.

Число аспирантов, человек.

Всего.

Из них женщины.

Л.

23 772.

28 275.

11 041.

22 653.

14 193.

Всего.

109 118.

47 659.

отдельных групп становятся несопоставимыми. Для приведения их к сравниваемому виду используют плотность распределения,.

Распределение численности докторантов, но возрастным группам в Российской Федерации в 2012 г.

Группы докторантов по возрасту, лет.

Число докторантов, человек.

Накопленные частоты.

А.

До 35.

35—45.

45—55.

55 и более.

Всего.

—.

т.е. определяют, сколько составляющих каждой группы приходится на величину интервала. Различают абсолютную и относительную плотности распределения. Абсолютная плотность распределения — это частота, соответствующая единице длины интервала, относительная плотность распределения — это частость, приходящаяся на единицу длины интервала. Их значения рассчитываются по следующим формулам:

абсолютная плотность распределения

Ряды распределения. Теория статистики с элементами эконометрики в 2 ч. Часть 1.

относительная плотность распределения

Ряды распределения. Теория статистики с элементами эконометрики в 2 ч. Часть 1.

где f — частота; w, — частость; /г, — величина (шаг) интервала.

Пример 3.4.

Имеются данные о среднедушевых денежных доходах населения Российской Федерации в 2012 г., группировка которых произведена на основе неравных интервалов (табл. 3.9). Представленный ряд распределения, четко отображая изменения в обследуемой совокупности, в то же время затрудняет сравнение весов имеющихся интервалов. Для сопоставления долей населения, относящихся к каждой из выделенных групп, исчисляется относительная плотность распределения. С этой целью определяется шаг интервала как разность между его верхней и нижней границами для всех групп. По причине объективной сложности безошибочной оценки истинных пределов бедности и богатства ширина открытых интервалов принимается равной величинам смежных с ними групп. Так, нижняя граница первого интервала составляет 2000 руб., верхняя граница последнего — 45 000 руб. Делением частостей групп на соответствующие им длины интервалов получаются плотности распределения. Если, исходя из долевого распределения населения по величине среднедушевых доходов, максимальный процент характеризует интервал от 15 000 до 25 000 руб., то согласно плотностям распределения наиболее заполненной оказывается группа от 7000 до 10 000 руб. На фоне установленного размера прожиточного минимума полученный количественный показатель переходит в категорию социальных индикаторов.

Таблица 3.9

Распределение населения Российской Федерации, но величине среднедушевых денежных доходов в 2012 г.

Группы населения, но величине среднедушевых доходов, руб.

Доля населения Wj, % к итогу.

Ширина интервала А, руб.

Плотность распределения.

/"? = щ/К

А.

До 3500.

2,2.

0,0015.

3500−5000.

3,7.

0,0025.

5000−7000.

7,0.

0,0035.

7000−10 000.

12,1.

0,0040.

10 000−15 000.

18,8.

0,0038.

15 000−25 000.

25,3.

10 000.

0,0025.

25 000−35 000.

13,3.

10 000.

0,0013.

Более 35 000.

17,6.

10 000.

0,0018.

Всего.

100,0.

;

;

Для детального изучения частотных изменений внутри ряда распределения составляется ряд накопленных частот (кумулятивный ряд) — ряд, показывающий количество случаев выше или ниже определенного уровня. Накопленные частоты находятся посредством последовательного прибавления к частотам первой группы частот последующих групп. Последнее значение кумулятивного ряда совпадает с объемом распределения. Так, но данным табл. 3.8 около одной трети докторантов (1369) моложе 35 лет, возраст более чем половины из них (3146 человек) не превышает 45, подавляющее большинство (4140 из 4554) не старше 55. Аналогично может быть рассчитан ряд накопленных частостей.

Необходимая наглядность при изучении формы распределения достигается путем построения графиков. Для изображения вариационных рядов применяются полигон, гистограмма, кумулята и огива. Дискретный ряд передается с помощью полигона — замкнутого многоугольника, абсциссами вершин которого являются значения варьирующего признака, а ординатами — соответствующие им веса. Для представления интервального ряда используется гистограмма — столбики с основаниями, равными ширине интервалов, и высотами, отображающими веса1. Гистограмма может быть преобразована в полигон: для этого середины вершин столбцов соединяются прямыми линиями, а две крайние точки замыкаются по оси абсцисс. В случае вариационного ряда с неравными интервалами на оси ординат откладываются плотности распределения. Ряд накопленных частот адекватен кумулятивной кривой (рис. 3.10). Если по оси абсцисс расположены варианты признака[2][3], а по оси ординат — накопленные частоты, то такая ломаная линия называется кумулятой. «Перевернув» кумуляту, можно получить огиву — ломаную линию, по оси абсцисс которой размещены накопленные частоты, а по оси ординат — варианты ряда. Аналогично получается ряд накопленных частостей. Полигон распределения показан на рис. 3.11, гистограмма — на рис. 3.12, кумулята — на рис. 3.13.

Классификация видов кумулятивной кривой.

Рис. 3.10. Классификация видов кумулятивной кривой.

График, сочетающий гистограмму и ряд накопленных, называется диаграммой Парето; в данном случае кумулятивная кривая накладывается на столбики-прямоугольники, расположенные в порядке убывания значений признака (рис. 3.14). График используется для отграничения факторов, оказывающих существенное влияние на распределение, от остальных. В связи с этим диаграмма иногда именуется «правилом 80—20»: 80% результата, как правило, обусловлено действием не более чем 20% всех выде;

Полигон распределения численности аспирантов по возрастным группам (от 23 до 29 лет) в Российской Федерации в 2012 г.

Рис. 3.11. Полигон распределения численности аспирантов по возрастным группам (от 23 до 29 лет) в Российской Федерации в 2012 г.

Гистограмма распределения численности докторантов по возрастным группам в Российской Федерации в 2012 г.

Рис. 3.12. Гистограмма распределения численности докторантов по возрастным группам в Российской Федерации в 2012 г.

ленных факторов. График назван в честь известного итальянского экономиста В. Парето (Vilfredo Pareto, 1848—1923), посредством подобного графического изображения выявившего долю факторов, чаще всего становящихся причиной дефектов производимой продукции. Определение числового соотношения 80—20 также принадлежит Парето, вскрывшего внутреннюю структуру распределения доходов итальянских домохозяйств, согласно которой 80% доходов было сосредоточено в руках лишь 20% семей.

Кумулята распределения численности докторантов по возрастным группам в Российской Федерации в 2012 г.

Рис. 3.13. Кумулята распределения численности докторантов по возрастным группам в Российской Федерации в 2012 г.

Диаграмма Парето.

Рис. 3.14. Диаграмма Парето.

Особым способом графического изображения рядов распределения является построение «ящика с усами»[4]. Для его создания ранжированный в порядке возрастания признака ряд разбивается на четыре равновеликие части. Минимальная и максимальная величины в распределении задают предельные точки графика или его «усы». Между ними размещается «ящик», стенки которого отделяют две крайние четверти совокупности — с наименьшими и наибольшими значениями признака соответственно; таким образом, в «ящик» заключается ровно половина всех центральных наблюдений (рис. 3.15). Порядок расчета искомых показателей (отсекающих 25, 50 и 75% ряда) будет приведен в главе, посвященной изучению вариации.

График «ящик с усами».

Рис. 3.15. График «ящик с усами».

  • [1] Все ряды распределения текущего параграфа построены по данным официального сайта Росстата.
  • [2] Слово «гистограмма» было введено в статистику знаменитым английскимученым К. Пирсоном (Karl Pearson, 1857—1936) в 1895 г.; однако сам термин первоначально применялся им для общего описания рядов распределения, представленных в графической форме.
  • [3] Необходимо учитывать, что кумулятивная кривая для интервального вариационного ряда распределения строится в соответствии с показателями верхнихграниц групп.
  • [4] График был разработан американским математиком Д. Тьюки (John WilderTukey, 1915—2000) в 1970;х гг.; свое специфическое название получил из-занеобычного внешнего вида.
Показать весь текст
Заполнить форму текущей работой