Статистический анализ
В населенном пункте Б уровень рассматриваемой преступности выше, чем в населенном пункте А. Обострение преступности произошло в 5 пятилетки. 7-ая пятилетка была спокойнее остальных. Вычисление средних значений позволило сделать вывод о почти двукратном превышении показателя преступности в населенном пункте Б. Это подтверждает и сравнительная диаграмма 3. Как и ожидалось, корреляционная… Читать ещё >
Статистический анализ (реферат, курсовая, диплом, контрольная)
1. Анализ распределения элементов статистического ряда
Исходная таблица содержит данные по количеству выявленных лиц, совершивших кражи чужого имущества в населенных пунктах, А и Б с 1961 по 2000 гг. В то время было принято измерять временные интервалы пятилетиями. В интервале с 1961 г. по 2000 г. укладывается ровно 8 пятилеток.
Таблица 1. Группировочная таблица по числу выявленных лиц в населенных пунктах, А и Б с 1 по 8 пятилетку
Пятилетка | |||||||||
Населенный пункт А | |||||||||
Населенный пункт Б | |||||||||
С точки зрения статистики у нас появились два вариационных ряда для признаков Х (населенный пункт А) и У (населенный пункт Б) с одинаковым числом вариантов n = 8 без выделения частот и относительных частот. Одновременно эти ряды являются рядами динамики для одного и того же временного интервала с 1 по 8 пятилетку. Графически они могут быть представлены в виде полигонов как ряды динамики.
В рамках данной темы целесообразнее рассматривать интервальные ряды для распределения числа выявленных лиц по населенным пунктам, А и Б.
Таблица 2. Интервальные ряды для числа выявленных лиц по населенным пунктам, А и Б
№ | |||||||||
А | |||||||||
Б | |||||||||
Таблица 2 служит таблицей частот. Для построения гистограмм лучше рассмотреть относительные частоты.
Таблица 3. Статистическое распределение интервальных рядов
i | |||||||||
(Wi) А | 0,14 | 0,09 | 0,19 | 0,11 | 0,13 | 0,19 | 0,06 | 0,09 | |
(Wi) Б | 0,14 | 0,14 | 0,13 | 0,15 | 0,17 | 0,11 | 0,07 | 0,10 | |
Относительные частоты вычисляются по формуле:
Wi = ni/n, (n = 1, 2, 3, …, 8),
где nа = 1244, nб = 2643
Диаграмма 1. Гистограмма относительных частот числа выявленных лиц по населенному пункту А
Диаграмма 2. Гистограмма относительных частот числа выявленных лиц по населенному пункту Б
Населенный пункт, А характеризуется неравномерностью распределения числа выявленных лиц, совершивших кражи. Пики преступности данного вида приходятся на 3 и 6 пятилетки. Относительное снижение преступности отмечается в 7 пятилетке (выявлено всего 79 лиц, относительная частота на гистограмме составил W7 = 0,06). В целом усматривается незначительное снижение уровня преступности.
В населенном пункте Б уровень рассматриваемой преступности выше, чем в населенном пункте А. Обострение преступности произошло в 5 пятилетки. 7-ая пятилетка была спокойнее остальных.
2. Вычисление основных статистических параметров
Таблица 4. Основные статистические параметры рядов распределения
Среднее значение | Среднее квадратичное отклонение | Асимметрия | Эксцесс | ||
А | 155,5 | 53,661 | 0,33 | 46,135 | |
Б | 330,375 | 80,404 | — 0,39 | — 0,66 | |
Среднее значение вычисляется по формуле:
Х = 1/8 ?х
Среднее квадратичное отклонение
б = vх2 — (х)2
Асимметрия
As = М3/ б3
Эксцесс
Ех = М4/ б4
где М3 = 1/8 ?(хi — х)3,
М4 = 1/8 ?(хi — х)4.
Отметим промежуточные результаты:
М3(А) = 51 664,875;
М4(А) = 407 404 409,3;
М3(Б) = -201 499,2539;
М4(Б) = 97 879 670,62.
Видно, что в населенном пункте Б средний уровень преступности почти в 2 раза больше, чем в населенном пункте А.
У соответствующих двух рядов распределения разный характер асимметрии. Довольно большой эксцесс у первого признака, у второго — незначительный.
Заметим, что нулевое значение эксцесса характерно для нормального закона распределения (распределения Гаусса).
3. Анализ динамических рядов
Таблица 5. Ряды динамики числа выявленных лиц по населенным пунктам, А и Б
Номер пятилетки | |||||||||
Х | |||||||||
У | |||||||||
Таблица 6. Основные показатели динамики по населенному пункту А
Пятилетка | Число лиц | Абсолютный прирост (?) | Темп роста Тр, % | Темп прироста Тпр, % | Абсолютное значение 1% прироста | ||||
цеп ной | базис ный | цеп ной | базисный | цепной | базисный | ||||
; | ; | 100,0 | 100,0 | 0,0 | 0,0 | ; | |||
— 64 | — 64 | 63,0 | — 37,0 | — 37,0 | — 37,0 | 1,73 | |||
216,5 | 136,4 | 116,5 | 36,4 | 1,09 | |||||
— 99 | — 36 | 58,1 | 79,2 | — 41,9 | — 20,8 | 2,36 | |||
— 14 | 116,1 | 91,9 | 16,1 | — 8,1 | 1,37 | ||||
147,8 | 135,8 | 47,8 | 35,8 | 1,59 | |||||
— 166 | — 94 | 33,6 | 45,7 | — 66,4 | — 54,3 | 2,35 | |||
— 57 | 146,8 | 67,1 | 46,8 | — 32,9 | 0,79 | ||||
В среднем | 155,5 | — 8 | 82,5 | — 17,5 | |||||
Таблица 7. Основные показатели динамики по населенному пункту Б
Пятилетка | Число лиц | Абсолютный прирост (?) | Темп роста Тр, % | Темп прироста Тпр, % | Абсолютное значение 1% прироста | ||||
цеп ной | базис ный | цеп ной | базисный | цепной | базисный | ||||
; | ; | 100,0 | 100,0 | 0,0 | 0,0 | ; | |||
105,6 | 105,6 | 5,6 | 5,6 | 3,6 | |||||
— 41 | — 21 | 89,2 | 94,2 | — 10,8 | — 5,8 | 3,8 | |||
114,2 | 107,5 | 14,2 | 7,5 | 3,39 | |||||
117,3 | 126,1 | 17,3 | 26,1 | 3,87 | |||||
— 132 | — 74 | 63,0 | 79,4 | — 37,0 | — 20,6 | 4,54 | |||
— 105 | — 179 | 63,3 | 50,3 | — 36,7 | — 49,7 | 2,86 | |||
— 104 | 141,1 | 71,1 | 41,4 | — 28,9 | 1,81 | ||||
В среднем | 330,4 | — 15 | 87,2 | — 12,8 | |||||
Диаграмма 3. Графическое изображение рядов динамики по населенным пунктам, А (сплошная линия) и Б (пунктирная линия)
При заполнении таблиц 6 и 7 использованы формулы для цепной формы расчета:
? = у — уi,
Тр = уi/уi — 1,
Тпр = Тр — 1,
А = уi — 1/100
и для базисной формы:
? = уi — у0,
Тр = уi/у0,
Тпр = Тр — 1,
?- = ?/7,
Тр- = 7v (Тр)1 (Тр)2 … (Тр)7.
Графики и расчетные таблицы говорят о небольшом снижении уровня краж по населенным пунктам, А и Б. В среднем абсолютное снижение больше у населенного пункта Б, а темп снижения больше у пункта А. Но сам уровень преступности все время остается выше в населенном пункте Б.
4. Корреляционная зависимость
Парный коэффициент корреляции
Чху = ху- — х-*у-/бхбу.
После вычисления среднего значения
ху- = 1/8?хiyi = 52 514,25
получаем Чху = 0,26
Корреляционная зависимость слабая.
У величины Чху как у случайной величины есть среднее квадратичное отклонение
mч = v1-ч2/n-2 = 0,4
Величина tч = ч/ mч распределена по закону Стьюдента со степенью свободы к = n — 2 = 6.
При уровне значимости, а = 0,05
Табличное значение
tтабл = 2,4469
Предельная ошибка
?ч = tтабл * mч = 0,98.
Поскольку вообще -1?чху?1, то вычисленная ошибка? ч = 0,98 смысла не имеет. Причина кроется в слабой тесной связи признаков х и у.
5. Уравнение регрессии
Линейная регрессия у = а + вх рассчитывается по формуле:
? — у- = ч бу/бх (х-х-),
? — 330,4 = 0,26 * 80,404/53,661 (х — 155,5),
? = 0,39х + 269,8
Критерий Фишера имеет расчетное значение
F = (tч)4 = (ч/ mч)4 = 0.18
При надежности 95% табличное значение F табл = 5,99. со степенями свободы к1 = 1, к2 = 6.
Так как F = 0,18 ‹ 1, следует перейти к обратной величине Fфакт = 5,55. Но тогда и F табл = 233,97 для степеней свободы к1 = 6, к2 = 1.
Мы видим, что все уравнение регрессии не значимо.
Абсолютная ошибка? у зависит от конкретного значения х и рассчитывается по формуле:
?у = бост v1+1/8 + ?(х — х-)2/8бх2,
Где в свою очередь,
бост = v?(уi -?i)2/6.
По формуле? = 269,8 + 0,39х найдем восемь значений ?(х):
337 312 362 323 332 361 301 315
Значит, бост = 89,373.
Самая малая ошибка? у будет при х = х-:
(?у)min = 34,8 * 2,4469 = 232.
Для ошибки это слишком много. Это объясняется слабой теснотой корреляционной зависимости.
6. Обобщение статистических данных и статистический анализ
После группировки исходных данных по пятилетним периодам получились вариационные интервальные ряды.
Поэтому в их ранжировке нет необходимости.
После построения гистограмм выяснилось, что распределения сильно отличаются от распределения Гаусса. Поэтому их исследование с помощью понятий асимметрии и эксцесса становится формальным.
Вычисление средних значений позволило сделать вывод о почти двукратном превышении показателя преступности в населенном пункте Б. Это подтверждает и сравнительная диаграмма 3.
В течение первых шести пятилеток в населенных пунктах, А и Б отмечались противоположные тенденции по динамике уровня выявленных лиц, а в последние две пятилетки эти тенденции совпадали. В целом заметно небольшое снижение уровня преступности данного вида. На это указали и расчеты при заполнении таблиц 6 и 7.
Как и ожидалось, корреляционная зависимость показателей по двум населенным пунктам оказалась слабой. Оказалось незначимой и сама регрессионная линейная модель.
По этой причине потеряли практический смысл оценки ошибок для линейного коэффициента корреляции и для прогнозных значений регрессии.
1. Кремер Н. Ш., Путко Б. А. Эконометрика: Учебник для ВУЗов. М.: ЮНИТИ-ДАНА, 2005.
2. Практикум по эконометрике: Учебное пособие. Под ред. И. И. Елисеевой. М.: Финансы и статистика, 2003.
3. Эконометрика: Учебник. Под ред. И. И. Елисеевой. М.: Финансы и статистика, 2004.
4. Шимко П. Д., Власов М. П. Статистика/ Серия «Учебники, учебные пособия». — Ростов на Дону: Феникс, 2003.
5. Глинский В. В., Ионин В. Г. Статистический анализ: Учебное пособие. М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002.
6. Сборник задач по теории статистики: Учебное пособие / Под ред. В. В. Глинского и Л. К. Серга. — М.: ИНФРА-М; Новосибирск: Сибирское соглашение, 2002