Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Принципы построения статистических группировок

РефератПомощь в написанииУзнать стоимостьмоей работы

Выделение групп по количественным группировочным признакам связано с образованием интервалов по этим признакам. В случае, когда дискретный количественный признак изменяется в небольших пределах (например, число детей в семье 0, 1, 2, 3, 4, 5, более), выделяемые группы совпадают со значениями признаков. В случае, когда количественный признак изменяется значительно (например, уровень начисленной… Читать ещё >

Принципы построения статистических группировок (реферат, курсовая, диплом, контрольная)

Основные этапы осуществления статистических группировок можно объединить в следующие.

• Определение группировочного признака (основания группировки).

Группировочный признак — это признак, по которому происходит определение единиц в группе. Его выбор зависит от цели группировки и существа данного явления.

• Выделение числа групп.

Число групп определяется с таким расчетом, чтобы в каждую группу попало достаточно большое (для обобщения) число единиц совокупности. Число групп должно быть рациональным: не слишком большим, чтобы состав групп был наполненным, но и не слишком малым, чтобы заметить качественное отличие одной группы от другой.

• Определение интервалов.

Интервал — значение количественного признака, отделяющее группы или подгруппы. Интервалы могут быть равными и неравными.

• Непосредственное проведение группировки статистического материала по намеченным признакам и интервалам.

Рассмотрим подробнее четыре названных этапа группировки.

Определение группировочного признака. Основу для выбора группировочных признаков составляет раскрытие содержания изучаемых явлений. Например, при изучении демографической ситуации в стране одним из признаков, раскрывающих содержание проблемы, будет «наличие детей в семье».

Часто у явлений имеется множество существенных признаков, поэтому встает вопрос о выборе из них. Обычно для группировки отбирают рациональное, т. е. необходимое и достаточное, число признаков, которые определяют группу явлений, отображая ее важнейшие особенности. Например, если имеется несколько признаков, характеризующих явление с одной стороны, то из них следует взять только один. В частности, из трех признаков, характеризующих предприятие обрабатывающих производств с точки зрения затраченного труда (отработанные человеко-месяцы, человеко-дни и человеко-часы), для группировки достаточно воспользоваться одним из них.

Выделение числа групп. Выделение числа групп по атрибутивным и количественным признакам проводится по-разному. По атрибутивным (качественным) признакам число групп определяется просто: в зависимости от количества качественных градаций признака. Например, при группировке населения по брачному состоянию применяются четыре группы: никогда нс состоявшие в браке; состоящие в браке (в том числе в зарегистрированном и незарегистрированном); вдовые; разведенные и разошедшиеся.

Выделение групп по количественным группировочным признакам связано с образованием интервалов по этим признакам. В случае, когда дискретный количественный признак изменяется в небольших пределах (например, число детей в семье 0, 1, 2, 3, 4, 5, более), выделяемые группы совпадают со значениями признаков. В случае, когда количественный признак изменяется значительно (например, уровень начисленной заработной платы, рентабельность продукции, объем выполненных работ), число выделяемых групп зависит от степени колеблемости группировочного признака: чем больше колеблемость признака, тем больше можно выделить групп. Тогда целесообразно рассмотреть размах вариации, который определяется как разность максимального и минимального значений признака: R = xmax-xmin. Чем больше размах вариации признака, положенного в основу группировки, тем больше может быть организовано групп. Ограничением здесь будет наполненность групп: чем больше единиц в группе, тем лучше, но, как правило, должно быть не менее трех наблюдений).

В каждом конкретном случае при определении числа групп следует исходить не только из степени вариации признака, по и из особенностей объекта, цели и задач группировки. Определение оптимального числа групп основано на применении формулы Стерджесса:

Принципы построения статистических группировок.

где т — число групп; N — число единиц совокупности.

Из формулы видно, что выбор числа групп зависит от объема совокупности. Недостаток формулы Стерджесса заключается в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц. При определении оптимального количества групп данным методом существует вероятность получения «пустых» или мало наполненных групп. «Пустыми» называются группы, которые не содержат ни одной единицы совокупности.

Если групп оказывается много и они включают малое число единиц, то групповые показатели могут стать ненадежными. Поэтому альтернативой комбинационной группировке, характеризующейся большим дроблением групп, является многомерная группировка, которая осуществляется, но комплексу признаков одновременно. Ее применение требует использования специальных пакетов прикладных программ (например, SPSS). С помощью специально разработанных электронных программ формируются однородные группы на основании близости по всему комплексу признаков.

Определение интервалов. Определение числа групп тесно связано с понятием величины интервала: чем больше число групп, тем меньше величина интервала, и наоборот.

Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Величина интервала есть разность между верхней и нижней границами интервала. Если у интервала указана лишь одна граница, такой интервал называется открытым. У первого интервала часто известна только верхняя граница, у последнего — нижняя. Если у интервала имеются и нижняя, и верхняя 1раницы, то это закрытый интервал. Закрытые интервалы подразделяются на равные и неравные (прогрессивно возрастающие, прогрессивно убывающие), а также специализированные и произвольные. На примере табл. 3.3 открытыми интервалами группировки являются первый и последний, т. е. среднедушевые денежные доходы — до 2000,0 и свыше 25 000,0 руб. в месяц соответственно. Остальные интервалы табл. 3.3 являются закрытыми, неравными, прогрессивно возрастающими.

Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества, а также если распределение носит более или менее равномерный характер. Если можно заранее установить определенное количество групп, то величина равного интервала вычисляется по формуле.

Принципы построения статистических группировок.

где ix — величина равного интервала; xmax> *min — наибольшее и наименьшее значения группировочного признака; т — число групп.

Если не требуется предварительного установления числа групп, то используется другой способ определения величины равного интервала — по формуле Стерджесса:

Принципы построения статистических группировок.

где N — число наблюдений.

Если величина равного интервала рассчитывается по последней формуле, то следует знаменатель предварительно округлить до целого числа (как правило, всегда большего), так как количество групп не может быть дробным числом.

В статистической практике довольно часто применяются неравные интервалы (прогрессивно возрастающие или прогрессивно убывающие). При этом исследуемая совокупность делится на группы примерно равного заполнения с большим числом единиц. Неравные интервалы могут использоваться, например, в таких случаях:

  • а) при исследовании группировки с применением нескольких признаков, дающих возможность составить несколько подгрупп, где требуются и более длинные, и более короткие интервалы;
  • б) при образовании крупных групп с новым качеством на базе мелких групп при условии сохранения их однородности, что приводит к увеличению интервалов.

Могут использоваться также специализированные интервалы. Интервалы называют специализированными, если речь идет об установлении границ интервала в группах, схожих по типу и по признаку, но имеющих отношение, скажем, к разным видам деятельности. Например, понятие малого предприятия неоднозначно: в общем случае, малым называется предприятие, среднесписочная численность работников которого нс превышает 200 человек. При этом установлены и специальные границы численности: в промышленности и строительстве — до 200 человек; в науке и научном обслуживании — до 100; в других отраслях производственной сферы — до 50; в отраслях непроизводственной сферы и розничной торговли — до 15 человек.

Непосредственное проведение группировки статистического материала по намеченным признаками и группам. Данный этап предполагает преобразование массива собранного материала в виде групп и подгрупп, каждая из которых характеризуется численностью единиц совокупности и набором сопутствующих признаков, которые также возможно обобщить. Например, при изучении состава семей по числу детей, кроме группировочного признака, семьи могут быть охарактеризованы по возрасту родителей и детей, уровню образования, среднедушевому доходу, обеспеченности жильем и т. п.

Рассмотрим особенности осуществления статистических группировок па примерах построения типологических, структурных и аналитических группировок.

Построение типологических группировок. Задача типологической группировки — выявление социально-экономических типов или однородных в существенном отношении групп явлений.

Последовательность действий при проведении типологической группировки такова:

  • 1) указываются те типы явлений, которые могут существовать в составе изучаемой совокупности;
  • 2) выбираются группировочпые признаки, формирующие описания типов;
  • 3) устанавливаются границы интервалов, значений группировочных признаков, отделяющих один тип явлений от другого;
  • 4) составляется таблица, в которой на основе одного признака или комбинации признаков единицы совокупности объединяются в намеченные типы и определяется численность каждого из них.

Пример 3.1. Примером осуществления типологической группировки па основе комбинации признаков выступает группировка населения страны по трудоспособности. Чтобы получить информацию о потенциале трудовых ресурсов отдельного региона или страны в целом, в составе всей численности населения необходимо выделить несколько групп или типов лиц с точки зрения способности к труду. Начальными условиями для формирования таких типов является определение группировочных признаков и их значений, позволяющих отнести ту или иную единицу совокупности к тому или иному типу (группе).

С точки зрения отношения к труду важными выступают два признака — возраст и место проживания человека, поскольку согласно Трудовому кодексу РФ возрастом трудоспособности[1] считается возраст 16—59 лет для мужчин и 16—54 года для женщин. Отметим, что в данной группировке мы не будет учитывать особые условия досрочного пенсионного возраста лиц определенных профессий и здоровье населения, по состоянию которого люди могут получать пенсии ранее наступления 55 лет для женщин и 60 лет для мужчин.

В соответствии с данными условиями все население страны подразделяется на три группы (типа) по отношению к труду:

моложе трудоспособного возраста (мужчины и женщины в возрасте 0—15 лет включительно);

  • — трудоспособное население (мужчины в возрасте 16—59 лет и женщины в возрасте 16—54 года включительно);
  • — старше трудоспособного возраста (мужчины в возрасте 60 лет и старше и женщины в возрасте 55 лет и старше).

В данном случае речь пойдет о комбинационной группировке, где сначала все население будет поделено по месту проживания на городское и сельское, затем в каждой группе по полу будут выделены три возрастные группы, которые соответствуют каждому из запланированных к выделению типов (табл. 3.6). После этого производится объединение одноименных групп населения, принадлежащих к сельскому и городскому населению. В результате будет получена группировка населения по трудоспособности (табл. 3.7).

Таблица 3.6

Формирование типов трудоспособного населения на 1 января 2015 г.

Группы населения по месту жительства.

Группы населения, но возрасту трудоспособности, лет.

Типы населения трудоспособного возраста.

Численность на 1 января 2012 г., тыс. чел.

Городское.

ДО 16.

моложе трудоспособного.

18 138.

мужчины 16—59, женщины 16—54.

трудоспособное население.

64 223.

мужчины 60 и старше, женщины 55 и старше.

старше трудоспособного.

25 921.

Сельское.

до 16.

моложе трудоспособного.

мужчины 16—59, женщины 16—54.

трудоспособное население.

21 192.

мужчины 60 и старше, женщины 55 и старше.

старше трудоспособного.

Источник: www.gks.ru

Данные табл. 3.6 могут служить основой для последующего анализа, выполнения сравнений: например, какое население составляет подавляющее большинство в возрасте старше трудоспособного, в каком соотношении находятся городское и сельское население трудоспособного возраста, какова иждивенческая нагрузка трудоспособного населения (сколько лиц моложе и старше трудоспособного возраста приходится на одного трудоспособного россиянина) и т. п.

Таблица 3.7

Типы населения РФ по возрасту трудоспособности на 1 января 2015 г., тыс. чел.

Типы населения.

Всего.

В том числе.

городское.

сельское.

Все население.

146 267.

108 282.

37 985.

Типы населения.

Всего.

В том числе.

городское.

сельское.

В том числе в возрасте: моложе трудоспособного.

25 689.

18 138.

трудос пособном.

85 415.

64 223.

21 192.

старше трудоспособного.

35 163.

25 921.

Источник: www.gks.ru.

Данные табл. 3.7 представляют собой основу для выявления структуры населения страны по возрасту трудоспособности в разрезе городского и сельского населения. Представление аналогичной информации за два периода и более послужит основой для анализа динамических и структурных изменений.

Построение структурных группировок. Задача структурной группировки — охарактеризовать структуру совокупности по какому-либо признаку. Структурная группировка может быть построена как по качественному признаку, так и по количественному. Примерами группировки по качественному признаку могут быть: распределение населения по трудоспособности; распределение предприятий региона, но формам собственности или организационно-правовым формам хозяйствования; распределение населения страны по состоянию в браке. Примерами группировки по количественному признаку могут быть: распределение населения страны по уровню среднедушевого денежного дохода; распределение семей в регионе по числу детей в семье; распределение строительных предприятий по размеру полученной прибыли. Понятие «структурная группировка» тесно связано с понятием «ряда распределения». Рядом распределения можно назвать структурную группировку по одному признаку, когда выделенные группы охарактеризованы одним показателем их численностью. Группировки по количественному признаку иначе называются вариационными рядами и служат предметом специального изучения.

Для характеристики изменения структуры совокупности используют обобщающие показатели структурных сдвигов. Основными показателями структурных сдвигов являются средний абсолютный показатель изменения структуры, средний квадратический показатель изменения структуры и индекс различий.

Кроме анализа изменений в структуре одного явления с течением времени (структурных сдвигов), статистика позволяет оценить различия в составе структур двух (и более) совокупностей в один и тот же период времени (так называемые территориальные различия). Например, так можно изучить различие в составе семей России, Франции и Германии по числу детей в семье либо оценить различия в составе валового внутреннего продукта России, США и Великобритании по элементам конечного использования. В этом случае названные обобщающие показатели будут трактоваться как обобщающие показатели структурных различий.

Таблица 3.8

Группировка населения РФ по возрастным группам (на начало года)

Население.

Годы.

тыс. чел.

о/

к итогу.

тыс. чел.

%.

к итогу.

тыс. чел.

о/

к итогу.

Общая численность.

146 304.

142 754.

146 267.

В том числе в возрасте:

моложе трудоспособного.

28 387.

19,4.

23 317.

16,3.

25 689.

17,6.

трудоспособном.

88 040.

60,2.

90 328.

63,3.

85 415.

58,4.

старше трудоспособного.

29 877.

20,4.

29 109.

20,4.

35 163.

24.0.

Рассмотрим, например, изменение возрастной структуры россиян в 2015 г. но сравнению с 2001 г. при помощи индекса различий:

Принципы построения статистических группировок.

Рассмотрим также изменение возрастной структуры россиян в 2012 г. но сравнению с 2006 г. при помощи индекса различий:

Принципы построения статистических группировок.

Индекс различий принимает значения от 0 до 1, и чем он ближе к 0, тем меньшие структурные сдвиги имели место в составе изучаемой совокупности, а чем ближе к 1 — тем более значительные. Поэтому можно констатировать, что за время обоих изучаемых периодов сдвиги в составе населения по возрасту трудоспособности были незначительными, однако в 2006 г. по сравнению с 2001 г. они были менее заметными, чем в 2015 г. по сравнению с 2006 г.

Пример 3.3. Оценим структурные различия, наблюдаемые в структуре ВВП по доходам в России в сравнении с некоторыми странами мира (табл. 3.9).

Структура валового внутреннего продукта по доходам в 2010 г.

Таблица 3.9

Страна.

ВВП всего.

В том числе.

оплата труда наемных работников.

валовая прибыль и смешанный доход.

налоги на производство и импорт за минусом субсидий.

Россия.

49,8.

30,2.

20,0.

Германия.

50,9.

39,0.

10,0.

Франция.

53,4.

33,5.

13,1.

Япония.

54,4.

38,0.

7,6.

(в текущих ценах), % к итогу С целью получения представления о различиях в структуре ВВП по доходам рассчитаем абсолютный показатель обобщающих структурных различий Sa (при этом гп = 3, так как именно три вида первичных доходов выделяются в составе ВВП согласно системе национальных счетов[2]). Промежуточные вычисления оформим в виде таблицы (табл. 3.10).

Таблица 3.10

Расчет обобщающих показателей структурных различий в составе ВВП

Виды первичных доходов в составе ВВП.

Россия в сравнении.

Оплата труда наемных работников.

1,1.

3,6.

4,6.

Валовая прибыль и смешанный доход.

8.8.

3,3.

7.8.

Налоги на производство и импорт за минусом субсидий.

10,0.

6.9.

12,4.

М Ч®;

19,9.

13,8.

24,8.

Средний абсолютный показатель обобщающих структурных различий (Sa), и.и.

6,6.

4,6.

8,3.

Расчеты показывают, что наиболее значительные структурные различия в составе ВВП наблюдаются у России с Германией, абсолютный показатель обобщающих структурных различий между которыми составил 11,7 процентных пункта. Менее значительные различия мы видим между Россией и Японией, где Sa = 7,4 п.п., наименьшие — между Россией и Францией, где Sa = 4,2 п.п.

Построение аналитических группировок. Статистическая наука располагает большим набором приемов выявления связи между признаками. Одни приемы можно отнести к элементарным, другие, более сложные, предусматривают использование специального математического аппарата (гл. 8). Аналитическая группировка, как и предшествующий ей метод параллельных рядов, относится к простейшим методам выявления взаимосвязи признаков.

Задача аналитической группировоки — выявление взаимосвязи и взаимозависимости между исследуемыми явлениями через их признаки, из которых один рассматривается как результат (У), другой (другие) — как фактор (X), или факторы (Х1? Х2, Х"). Суть аналитической группировки заключается в исследовании того, как с изменением одного признака (факторного) меняются значения другого признака (результативного). В случае обнаружения такой зависимости применяется статистический инструментарий для измерения се силы и тесноты.

Если рассматривается связь между признаком-результатом и одним признаком-фактором, речь идет об однофакторной аналитической группировке. Если рассматривается связь двух и более признаков-факторов с признаком-результатом, то строится многофакторная группировка.

Рассмотрим метод параллельных рядов. Метод параллельных рядов обычно используется для установления характера связи при относительно небольшом объеме исходного материала. В одной таблице приводятся упорядоченные значения факторного признака (X) и соответствующие им значения результативного признака (У). Наличие и характер связи определяется по степени согласованности вариации данных рядов. В тех случаях, когда возрастание величины факторного признака влечет за собой возрастание величины результативного признака, говорят о возможном наличии прямой связи. Если же с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную связь между этими признаками.

Пример 3.4. Предполагая, что между доходом и числом детей в семье имеет место связь, проверим это по данным федеральных округов РФ. В качестве результативного признака (У) возьмем общий коэффициент рождаемости (%о)[3], в качестве факторного, т. е. признака, оказывающего влияние, возьмем показатель среднедушевых денежных доходов (X). В табл. 3.11 распределим федеральные округа России, но возрастанию факторного признака и сравним, повышается или снижается при этом показатель рождаемости.

Таблица 3.11

Характеристика зависимости рождаемости от уровня доходов по данным федеральных округов РФ в 2014 г.

Федеральный округ.

Среднедушевой денежный доход, руб/мсс.

Общий коэффициент рождаемости,

СевероКавказский.

20 717.

12,8.

Сибирский.

21 490.

14,7.

Южный.

24 327.

12,8.

11риволжский.

24 027.

13,3.

СевероЗапади ы й.

28 633.

12,3.

Дал ьневосточ н ы й.

31 974.

14,1.

Уральский.

30 494.

15,1.

Центральный.

34 984.

11,4.

По данным табл. 3.11 можно сказать, что с увеличением уровня дохода нет четкой тенденции к росту или снижению уровня рождаемости. Однако отметим, что самый высокий уровень рождаемости наблюдается в Северо-Кавказском федеральном округе, где уровень дохода самый низкий, и, наоборот, самый низкий уровень рождаемости регистрируется в Центральном федеральном округе (11,4 новорожденных на 1000 человек населения), где в 2014 г. наблюдался самый высокий среднемесячный душевой доход — 34 984 руб. Оценить, насколько сильно связаны эти два явления, можно при помощи аналитической группировки и других методов выявления связи, и обязательно по более массовому статистическому материалу (например, в разрезе краев и областей Российской Федерации, где число субъектов достигает 85).

Недостатки метода параллельных рядов. При большом объеме материала для сопоставления визуальное сравнение двух параллельных рядов трудно выполнить. В этом случае необходимо обращаться к графическому методу или к более сложным методам выявления связи между признаками. Кроме того, при наличии большого числа значений признаков, когда одному и тому же значению признака-фактора соответствует несколько различных значений результативного признака, восприятие параллельных рядов сильно затрудняется.

Последовательность действий при проведении аналитической группировки такова:

  • 1) данные группируются в интервалы, но признаку-фактору, затем для каждого интервала по X определяется середина;
  • 2) значения признака-результата объединяются по соответствующим группам, рассчитывается среднее значение результативного признака для каждой группы;
  • 3) на основе сопоставлений изменений средних значений признака-результата по группам с изменением фактора делаются выводы о наличии или отсутствии связи между признаками;
  • 4) для обеспечения сравнимости данных изменений группировку проводят с равными закрытыми интервалами либо рассчитывают изменение результата на единицу изменения фактора.

Методологию однофакторных аналитических (факторных) группировок рассмотрим на примере установления связи между уровнем безработицы и числом зарегистрированных разводов россиян по данным о 74 субъектах РФ (см. табл. 3.12). Прежде всего задумаемся, должна ли быть связь между этими показателями? Предварительный теоретический анализ показывает, что социальные и экономические процессы находятся в тесной связи, безработица и разводимость — два негативных явления в жизни общества. Предположим, что факт безработицы негативно сказывается на брачном состоянии населения, т. е. между данными признаками наблюдается прямая связь, при этом не особенно тесная, поскольку причинами разводимости, помимо того что супруг (-а) не работает, могут быть и многие другие.

Пример 3.5. Для установления фактического существования этой связи возьмем данные по 74 субъектам РФ, в табл. 3.12 приведем первые 10 пар значений по Северо-Западному федеральному округу.

Таблица 3.12

Уровень безработицы и число зарегистрированных разводов в Северо-Западном федеральном округе РФ.

Субъект РФ.

Уровень безработицы, но МОТ, %

Число зарегистрированных разводов.

Субъект РФ.

Уровень безработицы, но МОТ, %.

Число зарегистрированных разводов.

Республика Карелия.

6,2.

Ленинградская обл.

4.0.

Республика Коми.

10,0.

Мурманская обл.

6,5.

Архангельская об л.

5,6.

Новгородская обл.

5,2.

Вологодская об л.

4,1.

Псковская обл.

4,9.

Калининградская обл.

3,4.

Санкт;

Петербург.

2.1.

25 794.

Приведенные данные, по существу представляющие собой два параллельных ряда, позволяют сделать вывод о существовании связи между уровнем безработицы и числом разводов; и эта связь является, скорее, даже обратной: самый низкий процент безработицы и самое высокое число разводов зафиксированы в Санкт-Петербурге, самый высокий уровень безработицы в Республике Коми сопровождается в 5 раз меньшим числом зарегистрированных разводов. Однако не надо забывать о разной размерности данных субъектов: численность населения Санкт-Петербурга в 4,7 раза превышает численность населения Республики Коми (4568 тыс. человек: 968 тыс. человек). Во избежание подобных затруднений многие демографические характеристики исчисляются в расчете на 1000 человек населения (в промилле).

Отсутствие четкой тенденции к возрастанию или убыванию результативного признака с ростом факторного подтверждает наш тезис о том, что на разводимость влияет не только отсутствие работы у супруга, тем более, что безработица воспринимается как временное состояние человека, находящегося в возрасте трудоспособности. Чтобы выяснить, влияет ли безработицы на уровень разводи мости, необходимо применить такой прием, который устранит или смягчит влияние прочих, помимо безработицы, факторов на изучаемое явление. Таким приемом является аналитическая группировка.

Устрапеним из анализа четыре региона (Москву, Санкт-Петербург, Московскую область и Ингушетию), руководствуясь теми соображениями, что в первых трех наблюдаются аномально высокие значения по числу разводов, объяснимые их густонаселенностью, а в Ингушетии уровень безработицы имеет аномально высокое значение 47,3% при среднем значении по совокупности 6,8%. Приступим к построению аналитической группировки. После удаления данных по Ингушетии максимальный уровень безработицы составил 20,2%, минимальный — 2,5%. Для определения величины интервала по факторному признаку воспользуемся формулой.

Принципы построения статистических группировок.

определившись, что число выделяемых групп будет равно 4 (поскольку 3 группы — это минимально возможная для выявления тенденции размерность группировки, а достаточное число наблюдений позволяет взять большее число групп), получим.

Принципы построения статистических группировок.

Теперь объединим регионы в группы по одинаковому уровню безработицы по следующим интервалам: 2,5—6,9; 6,9—11,3; 11,3—15,7; 15,7—20,2. При этом последний интервал чуть длиннее (4,5) за счет сделанных ранее округлений. Во всех интервалах, кроме последнего, нижняя граница являегся закрытой, верхняя — открытой. В последнем интервале обе границы закрыты.

Произведя группировку и подсчет единиц в группах по факторному признаку, обрабатаем данные по результативному признаку. Для каждой группы, но названному признаку исчислим обобщающие показатели в виде средних или относительных величин, для этого предварительно определив суммарные значения данного показателя для каждой группы. В нашем примере определим среднее для региона число зарегистрированных разводов. Группировку и соответствующие расчеты оформим в табл. 3.13.

Таблица 3.13

Зависимость разводимости (числа зарегистрированных разводов) от уровня безработицы по МОТ, по регионам РФ,.

% экономически активного населения.

Группы субъектов РФ по уровню безработицы (Xj) по МОТ, %.

Число субъектов РФ.

Число зарегистрированных разводов.

всего, но группе регионов (?Ff).

на 1000 чел. (Г,).

2,5−6,9.

407 460.

5,8.

6,9−11,3.

154 506.

4,2.

11,3−15,7.

1,7.

15,7−20,2.

1,1.

Итого.

573 432.

5,0.

Сопоставление первой и последней граф табл. 3.13 свидетельствует о наличии связи между уровнем безработицы и средним числом зарегистрированных разводов по регионам России. Поскольку с ростом признака-фактора признак-результат уменьшается, связь между признаками обратная (если бы с ростом признака-фактора признак-результат увеличивался, речь шла бы о прямой связи).

Для того чтобы сделать вывод связи (линейная или нелинейная), рассчитаем изменения признака результата на единицу изменения признака-фактора. Такие величины называются показателями силы свят. Показатель силы связи отвечает на вопрос, как изменится признак-результат при изменении признака-фактора на одну единицу, и для каждой группы рассчитывается так:

а) для группировок с равными интервалами.

Принципы построения статистических группировок.

б) для группировок с неравными интервалами.

Принципы построения статистических группировок.

где Ьху — показатель силы связи в /-й группе; Y-, У._{ — средние значения признака-результата в j-й группе и в предыдущей (J — 1)-й группе; XI, Xj_j — середины интервалов признака-фактора в j-й группе и в предыдущей (] - 1)-й группе; ix — величина интервала группировки по признаку-фактору.

Если полученные показатели силы связи значительно отличаются по группам, делают вывод о наличии нелинейной связи, так как одинаковому приращению признака-фактора соответствуют разные приращения признака-результата. При близких по значению групповых показателях силы связи ФуХ{ ~ ЬуХ2 ~ Ьух^), когда одинаковому приращению признака-фактора соответствуют одинаковые приращения признака-результата, можно говорить о линейной связи между X и У. В этом случае рассчитывают средний показатель силы связи, который показывает, на сколько в среднем единиц своего абсолютного измерения изменится признак-результат при изменении признака-фактора на единицу своего абсолютного измерения:

Принципы построения статистических группировок.

где т — число групп в изучаемой совокупности; Ут, У{ — средние значения признака-результата в последней (т) и 1-й группах; Х11Г Х{ — середины интервалов признака-фактора в последней (т) и 1-й группах.

В случае прямой связи показатели силы связи имеют положительные значения ух > 0), в случае обратной — отрицательные ух < 0).

Рассчитаем показатели силы связи для нашего примера (табл. 3.14).

Таблица 3.14

Расчет показателей силы связи

Группы субъектов РФ, но уровню безработицы (Xj) но МОТ, %

Число разводов на 1000 человек.

Изменение уровня разводимости в среднем в одном регионе.

Сила связи, разводов на 1% безработицы.

2.5−6,9.

5.8.

;

;

6,9−11,3.

4,2.

— 1,6.

— 0,36.

11,3−15,7.

1,7.

— 2,5.

— 0,57.

15,7−20,2.

1,1.

— 0,6.

— 0,14.

Поскольку при переходе от одной группе к другой сила влияния признака-фактора уменьшается (последняя графа табл. 3.14), можно предположить, что между исследуемыми явлениями наблюдается связь нелинейной формы. Отрицательные значения показателей силы связи подтверждают обратный характер связи между уровнем безработицы и числом разводов в регионе. Показатель силы связи имеет наибольшую амплитуду значения в группе регионов, где уровень безработицы варьирует между 11,3 и 15,7%. При увеличении уровня безработицы в этих регионах на 1% можно ожидать среднего снижения уровня разводимости на 0,57%о.

Связи, выявленные в результате аналитических группировок, рекомендуется оценить с точки зрения их существенности (тесноты связи). Такую оценку можно дать посредством дисперсионного анализа!.

Для изучения влияния нескольких факторов на результат строится многофакторная аналитическая группировка в виде комбинационной группировки по признакам-факторам. Многофакторная группировка позволяет оценить влияние факторов на результат последовательно, т. е. путем закрепления прочих, помимо изучаемого, факторов на постоянном уровне. Метод многофакторной группировки, как и любой комбинационной, имеет в качестве недостатка большое дробление групп и наличие «пустых» групп.

Изучая связи между признаками на основе аналитических группировок, следует помнить, что надежность выводов при этом зависит от объема совокупности п (чем он больше, тем лучше) и количества выделенных групп т (от 3 до 6—8, определяемых путем пробы различных вариантов). При этом объем совокупности п должен в 6—10 раз превышать число выделяемых групп.

Три вида рассмотренных группировок, каждая из которых соответствует своей цели, тесно связаны между собой и переплетены. Выделяя типы явлений, мы одновременно изучаем и структуру совокупности по выделенным типам. Устанавливая те или иные взаимосвязи в структуре явлений, исследователь подходит к выявлению типов (классов) явлений.[4]

  • [1] Трудоспособный возраст — условная градация возраста человека в зависимости от возможности его участия в трудовой деятельности.
  • [2] Система национальных счетов (СПС) — система макроэкономических расчетов, принятая в странах с рыночными условиями хозяйствования. Представляет собой определенный набор взаимосвязанных счетов и балансовых таблиц, отражающих разные стадиипроизводственного процесса и важнейшие взаимосвязи в экономике страны. Ключевымипоказателями СПС выступают валовой внутренний продукт и национальный доход. ВВПна душу населения — показатель, применяемый в межстрановых сравнениях как показательуровня жизни населения.
  • [3] Общий коэффициент рождаемости — один из показателей интенсивности процессоврождаемости, определяемый как отношение числа родившихся за период к средней численности населения за тот же период. После умножения на 1000 получаем промилле (%о). Коэффициент рождаемости показывает, сколько детей рождается на 1000 человек населения.
  • [4] Дисперсионный анализ — это анализ основанный на правиле разложения дисперсии. С помощью дисперсионного анализа исследуют влияние одной или нескольких независимыхпеременных на одну зависимую переменную (одномерный анализ) или на несколько зависимых переменных (многомерный анализ). Этот метод рассмотрен в параграфе 8.3.
Показать весь текст
Заполнить форму текущей работой