Уральский федеральный округ
Таким образом, значение линейного коэффициента корреляции = 0,89 свидетельствует о наличии прямой и тесной связи временем эксплуатации и пробегом автомобиля. Для построения ряда распределения необходимо определить число групп и величину интервала. Для определения числа групп воспользуемся формулой Стерджесса: Модальный интервал определяется по наибольшей частоте. Для ряда Y наибольшее значение… Читать ещё >
Уральский федеральный округ (реферат, курсовая, диплом, контрольная)
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ОБЛАСТНОЙ УНИВЕРСИТЕТ Экономический факультет. Государственное и муниципальное управление.
Курсовая работа На тему: «Статистическое изучение социально-экономического явления.»
Вариант № 7.
Выполнила студентка заочного отделения группа 21
Живаева К.М.
Москва, 2008
- Введение
- Формирование исходной выборки
- Статистические распределения рядов признаков-факторов и результирующего признака
- Проверка однородности и нормальности
- Вывод зависимостей результирующего-признака от факторов-признаков
- Группировка
- Определение доверительного интервала
- Вычисление линейных коэффициентов корреляции, вывод уравнения регрессии
- Заключение
- Список источников
- Введение
- Целью данной работы является статистическое исследование взаимосвязей стоимости автомобиля марки «Хонда-Сивик» с факторными признаками: пробегом и временем эксплуатации; а также, на основании исследования выявления первичных факторов, влияющих на стоимость и вывод зависимости целевого параметра (стоимости) от первичного фактора.
- Для построения исходной выборки был выбран сайт www.auto.ru.
- Формирование исходной выборки
- Используя сайт auto.ru проводим выборочное исследование 50 автомобилей марки Хонда-Сивик.
- Исследуемые признаки:
- Y _ цена автомобиля, тыс.руб.;
- Х1 _ время эксплуатации, лет;
- Х2 _ пробег, тыс. км.
№ п/п | Марка | Y | Х1 | Х2 | |
Civic VII | |||||
Civic VII | |||||
Civic VII | |||||
Civic VII | |||||
Civic VII | |||||
Civic VII | |||||
Civic VII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Civic VIII | |||||
Статистические распределения рядов признаков-факторов и результирующего признака
Исследуем статистическое распределение признаков Х1 с помощью интервального вариационного ряда:
Интервальный ряд для Х 1 | |||
Х 1 | F 1 | Ср. цена тыс.руб. | |
0−1 | |||
1−2 | |||
2−3 | |||
3−4 | |||
4−5 | |||
5−6 | |||
Приведем графическое отображение ряда для Х1 в виде гистограммы и кумуляты:
Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для X1. Формула для вычисления среднего арифметического:
где — средняя по ряду распределения;
— средняя по i-му интервалу;
— частота i-го интервала (число автомобилей в интервале).
Мода — это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:
где — значение моды;
X0 — нижняя граница модального интервала;
h — величина модального интервала (1 год);
— частота модального интервала;
— частота интервала, предшествующая модальному;
— частота послемодального интервала.
Модальный интервал определяется по наибольшей частоте. Для ряда X1 наибольшее значение частоты равно 21, т. е. это будет интервал 0 лет, тогда значение моды:
Медиана — значение признака, лежащее в середине упорядоченного ряда распределения.
Номер медианы определяется по формуле:
где
n — число единиц в совокупности
т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.
Значение медианы можно определить по формуле:
где — значение медианы;
— нижняя граница медианного интервала;
— номер медианы;
— накопленная частота интервала, предшествующая медианному;
— частота медианного интервала.
По накопленной частоте определяем, что медиана будет находиться в интервале от 1 года до 2-х лет, тогда значение медианы:
Для вычисления дисперсии воспользуемся следующей формулой:
где — дисперсия;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Среднее квадратическое отклонение вычислим по следующей формуле:
где — дисперсия;
— среднее квадратическое отклонение;
Вычислим коэффициент вариации
где — коэффициент вариации;
— среднее квадратическое отклонение;
— среднее по ряду распределения.
Вычислим значения коэффициента ассиметрии:
где ;
— коэффициент ассиметрии;
— среднее квадратическое отклонение;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Вычислим значения коэффициента эксцесса:
где
— коэффициент эксцесса;
— среднее квадратическое отклонение;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Исследуем статистическое распределение признаков Х2 с помощью интервального вариационного ряда.
Для построения ряда распределения необходимо определить число групп и величину интервала. Для определения числа групп воспользуемся формулой Стерджесса:
гдеm — число групп (всегда целое);
n — число единиц в выборке, в нашем случае n= 50.
Вычислим m:
Величину интервала определим по формуле:
где Хmax — максимальное значение признака;
Хmin — минимальное значение признака;
m — число групп.
На основании полученных данных построим интервальный ряд для Х2:
Интервальный ряд для Х 2 | |||
Х 2 | F 2 | Ср. цена тыс.руб. | |
0 — 21 | |||
21 — 42 | |||
42 — 63 | |||
63 — 84 | |||
84 — 105 | |||
105 — 126 | |||
126 — 150 | |||
Приведем графическое отображение ряда для Х2 в виде гистограммы и кумуляты:
Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для X2. Формула для вычисления среднего арифметического:
где — средняя по ряду распределения;
— средняя по i-му интервалу;
— частота i-го интервала (число автомобилей в интервале).
Мода — это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:
где — значение моды;
— нижняя граница модального интервала;
h — величина модального интервала (1 год);
— частота модального интервала;
— частота интервала, предшествующая модальному;
— частота послемодального интервала.
Модальный интервал определяется по наибольшей частоте. Для ряда X1 наибольшее значение частоты равно 25, т. е. это будет интервал 0 до 21 тыс. км., тогда значение моды:
Медиана — значение признака, лежащее в середине упорядоченного ряда распределения.
Номер медианы определяется по формуле:
где
n — число единиц в совокупности
т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.
Значение медианы можно определить по формуле:
гдезначение медианы;
— нижняя граница медианного интервала;
— номер медианы;
— накопленная частота интервала, предшествующая медианному;
— частота медианного интервала.
По накопленной частоте определяем, что медиана будет находиться в интервале от 21 до 42 тыс. км., тогда значение медианы:
Для вычисления дисперсии воспользуемся следующей формулой:
где — дисперсия;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Среднее квадратическое отклонение вычислим по следующей формуле:
где — дисперсия;
— среднее квадратическое отклонение;
Вычислим коэффициент вариации
где — коэффициент вариации;
— среднее квадратическое отклонение;
— среднее по ряду распределения.
Вычислим значения коэффициента ассиметрии:
где
— коэффициент ассиметрии
— среднее квадратическое отклонение;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Вычислим значения коэффициента эксцесса:
где;
— коэффициент эксцесса;
— среднее квадратическое отклонение;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Исследуем статистическое распределение признаков Y с помощью интервального вариационного ряда.
Величину интервала определим по формуле, используя полученное ранее значение m:
где Хmax — максимальное значение признака;
Хmin — минимальное значение признака;
m — число групп.
На основании полученных данных построим интервальный ряд для Y:
Интервальный ряд для Y | |||
Y | Fy | Ср. цена тыс.руб. | |
379 — 422 | 400,5 | ||
422 — 465 | 443,5 | ||
465 — 508 | 486,5 | ||
508 — 551 | 529,5 | ||
551 — 594 | 572,5 | ||
594 — 637 | 615,5 | ||
637 — 683 | |||
Приведем графическое отображение ряда для Y в виде гистограммы и кумуляты:
Вычислим среднюю арифметическую, моду и медиану интервального ряда распределения для Y. Формула для вычисления среднего арифметического:
где — средняя по ряду распределения;
— средняя по i-му интервалу;
— частота i-го интервала (число автомобилей в интервале).
Мода — это наиболее часто встречающееся значение признака. Для интервального ряда мода определяется по формуле:
где — значение моды;
Y0 — нижняя граница модального интервала;
hвеличина модального интервала;
— частота модального интервала;
— частота интервала, предшествующая модальному;
— частота послемодального интервала.
Модальный интервал определяется по наибольшей частоте. Для ряда Y наибольшее значение частоты равно 12, т. е. это будет интервал 551−594, тогда значение моды:
Медиана — значение признака, лежащее в середине упорядоченного ряда распределения.
Номер медианы определяется по формуле:
где ;
n — число единиц в совокупности;
т.к. медиана с дробным номером не бывает, то полученный результат указывает, что медиана находится между 25-й и 26-й величинами совокупности.
Значение медианы можно определить по формуле:
где — значение медианы;
— нижняя граница медианного интервала;
— номер медианы;
— накопленная частота интервала, предшествующего медианному;
— частота медианного интервала;
По накопленной частоте определяем, что медиана будет находиться в интервале 551−594, тогда значение медианы:
Для вычисления дисперсии воспользуемся следующей формулой:
где — дисперсия;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Среднее квадратическое отклонение вычислим по следующей формуле:
где — дисперсия;
— среднее квадратическое отклонение;
Вычислим коэффициент вариации
где — коэффициент вариации;
— среднее квадратическое отклонение;
— среднее по ряду распределения.
Вычислим значения коэффициента ассиметрии:
где
— коэффициент ассиметрии;
— среднее квадратическое отклонение;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Подставив значения, получим, что:
Вычислим значения коэффициента эксцесса:
где ;
— коэффициент эксцесса;
— среднее квадратическое отклонение;
— среднее по i-му интервалу;
— среднее по ряду распределения;
— частота i-го интервала;
n — размер выборки (n=50).
Проверка однородности и нормальности
Проверим интервальные распределения на однородность:
следовательно, совокупность для Х1 является неоднородной.
следовательно, совокупность для Х2 является неоднородной.
следовательно, совокупность для Y является однородной.
Исследуем нормальность распределения факторного признака Х1:
Интервалы значений признака-фактора | Число единиц, входящих в интервал | Удельный вес единиц, входящих в интервал, в общем их числе, % | Удельный вес единиц, входящих в интервал, при нормальном распределении, % | |
(1,6−1,25)-(1,6+1,25) 0,35 — 2,85 | 68,3 | |||
(1,6−2?1,25) — (1,6+2?1,25) — 0,9 — 4,1 | 95,4 | |||
(1,6−3?1,25) — (1,6+3?1,25) — 2,15 — 5,35 | 99,7 | |||
Таким образом, сопоставляя гр.3 и гр.4 делаем вывод: распределение Х1 относительно близко к нормальному, но не подчиняется ему.
Исследуем нормальность распределения факторного признака Х2:
Интервалы значений признака-фактора | Число единиц, входящих в интервал | Удельный вес единиц, входящих в интервал, в общем их числе, % | Удельный вес единиц, входящих в интервал, при нормальном распределении, % | |
(36,15−34,03)-(36,15+34,03) 2,12 — 70,18 | 68,3 | |||
(36,15−2?34,03) — (36,15+2?34,03) — 31,91 — 104,21 | 95,4 | |||
(36,15−3?34,03) — (36,15+3?34,03) — 65,94 — 138,24 | 99,7 | |||
Таким образом, сопоставляя гр.3 и гр.4 делаем вывод: распределение Х2 близко к нормальному, но не подчиняется ему.
Таким образом, проведя анализ на нормальность распределения мы можем отобрать данные не попадающие в диапазон 3х у. Для ряда Х1 таких значений нет. Для ряда Х2 исключаем значение с пробегом 150 тыс. км.
С учетом отфильтрованных по правилу 3х сигм составим интервальные ряды для Х1, Х2, Y.
Вывод зависимостей результирующего-признака от факторов-признаков
Интервальный ряд для Х 1 | |||
Х 1 | F 1 | Ср. цена тыс.руб. | |
0−1 | |||
1−2 | |||
2−3 | |||
3−4 | |||
4−5 | |||
5−6 | |||
Интервальный ряд для Х 2 | |||
Х 2 | F 2 | Ср. цена тыс.руб. | |
0 — 21 | |||
21 — 42 | |||
42 — 63 | |||
63 — 84 | |||
84 — 105 | |||
105 — 126 | |||
Интервальный ряд для Y | |||
Y | F y | Ср. цена тыс.руб. | |
379 — 422 | 400,5 | ||
422 — 465 | 443,5 | ||
465 — 508 | 486,5 | ||
508 — 551 | 529,5 | ||
551 — 594 | 572,5 | ||
594 — 637 | 615,5 | ||
637 — 683 | |||
Проведем аналитические группировки продаваемых автомобилей по времени эксплуатации и пробегу и определим групповые средние.
Построим график Y (X1)
Зависимость цены от времени эксплуатации существует и носит линейный характер, чем больше время эксплуатации, тем дешевле автомобиль.
Построим график Y (X2)
Зависимость цены от пробега существует и носит линейный характер, чем больше пробег автомобиля, тем дешевле автомобиль.
Группировка
На основании данных статистического наблюдения выделим три типа автомобилей:
· по времени эксплуатации:
o новые автомобили от 0 до 1 года — 34 шт.
o средние автомобили от 2 до 3 лет — 13 шт.
o старые автомобили от 3 до 5 лет — 3 шт.
· по пробегу:
o новые автомобили от 0 до 50 тыс. км. — 36 шт.
o средние автомобили от 50 до 100 тыс.км. — 11 шт.
o старые автомобили от 100 до 150 тыс.км. — 3 шт.
· по цене:
o новые автомобили от 581 до 683 тыс. руб. — 19 шт.
o средние автомобили от 480 до 581 тыс. руб. — 12 шт.
o старые автомобили от 379 до 480 тыс. руб. — 12 шт.
Определение доверительного интервала
Определим доверительный интервал, в котором заключена средняя цена всех продаваемых автомобилей, с вероятностью 0,9.
При вероятности 0,9 t = 1,64
Следовательно:
Таким образом, с вероятностью 0,9 можно утверждать, что средняя цена автомобиля равна:
Определим доверительный интервал, в котором заключена средняя цена всех продаваемых автомобилей, с вероятностью 0,95.
При вероятности 0,95 t = 1,96
Следовательно:
Таким образом, с вероятностью 0,95 можно утверждать, что средняя цена автомобиля равна:
Определим необходимую численность выборки при определении средней цены продаваемых автомобилей, чтобы с вероятностью 0,95 предельная ошибка выборки не превышала 10 тыс. руб.
Вычисление линейных коэффициентов корреляции, вывод уравнения регрессии
На основании выборочного наблюдения оценим степень тесноты связи и проведем оценку ее существенности:
Для определения степени тесноты парной линей зависимости используем линейный коэффициент корреляции® :
Для вычисления линейных коэффициентов корреляции составим вспомогательную таблицу:
1,6 | 36,15 | 509,8 | 3,4 | 84,85 | — 130,8 | — 444,72 | — 11 098,4 | 288,49 | ||||
1,6 | 36,15 | 509,8 | 2,4 | 37,85 | — 110,8 | — 265,92 | — 4193,78 | 90,84 | ||||
1,6 | 36,15 | 509,8 | 2,4 | 51,85 | — 80,8 | — 193,92 | — 4189,48 | 124,44 | ||||
1,6 | 36,15 | 509,8 | 1,4 | 58,85 | — 116,8 | — 163,52 | — 6873,68 | 82,39 | ||||
1,6 | 36,15 | 509,8 | 1,4 | 23,85 | — 112,8 | — 157,92 | — 2690,28 | 33,39 | ||||
1,6 | 36,15 | 509,8 | 1,4 | 17,85 | — 79,8 | — 111,72 | — 1424,43 | 24,99 | ||||
1,6 | 36,15 | 509,8 | 1,4 | 9,85 | — 50,8 | — 71,12 | — 500,38 | 13,79 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 70,85 | — 54,8 | — 21,92 | — 3882,58 | 28,34 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 10,85 | — 42,8 | — 17,12 | — 464,38 | 4,34 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 60,85 | — 41,8 | — 16,72 | — 2543,53 | 24,34 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 23,85 | 42,2 | 16,88 | 1006,47 | 9,54 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 4,85 | 55,2 | 22,08 | 267,72 | 1,94 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 20,85 | 60,2 | 24,08 | 1255,17 | 8,34 | ||||
1,6 | 36,15 | 509,8 | 0,4 | — 6,15 | 69,2 | 27,68 | — 425,58 | — 2,46 | ||||
1,6 | 36,15 | 509,8 | 0,4 | 113,85 | 87,2 | 34,88 | 9927,72 | 45,54 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | 38,85 | — 68,8 | 41,28 | — 2672,88 | — 23,31 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 6,15 | — 43,8 | 26,28 | 269,37 | 3,69 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 21,15 | — 9,8 | 5,88 | 207,27 | 12,69 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 10,15 | 14,2 | — 8,52 | — 144,13 | 6,09 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 14,15 | 20,2 | — 12,12 | — 285,83 | 8,49 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 4,15 | 29,2 | — 17,52 | — 121,18 | 2,49 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | 25,85 | 45,2 | — 27,12 | 1168,42 | — 15,51 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 22,15 | 50,2 | — 30,12 | — 1111,93 | 13,29 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 6,15 | 65,2 | — 39,12 | — 400,98 | 3,69 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | 51,85 | 65,2 | — 39,12 | 3380,62 | — 31,11 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 18,15 | 90,2 | — 54,12 | — 1637,13 | 10,89 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 18,15 | 90,2 | — 54,12 | — 1637,13 | 10,89 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | 3,85 | 105,2 | — 63,12 | 405,02 | — 2,31 | ||||
1,6 | 36,15 | 509,8 | — 0,6 | — 22,15 | 170,2 | — 102,12 | — 3769,93 | 13,29 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 18,15 | 0,2 | — 0,32 | — 3,63 | 29,04 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 23,2 | — 37,12 | — 838,68 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 23,2 | — 37,12 | — 838,68 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 31,2 | — 49,92 | — 1127,88 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 31,2 | — 49,92 | — 1127,88 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 51,2 | — 81,92 | — 1850,88 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 7,15 | 60,2 | — 96,32 | — 430,43 | 11,44 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 75,2 | — 120,32 | — 2718,48 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 80,2 | — 128,32 | — 2899,23 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 96,2 | — 153,92 | — 3477,63 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 106,2 | — 169,92 | — 3839,13 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 130,2 | — 208,32 | — 4706,73 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 130,2 | — 208,32 | — 4706,73 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 130,2 | — 208,32 | — 4706,73 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 133,2 | — 213,12 | — 4815,18 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 26,15 | 140,2 | — 224,32 | — 3666,23 | 41,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 140,2 | — 224,32 | — 5068,23 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 151,2 | — 241,92 | — 5465,88 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 151,2 | — 241,92 | — 5465,88 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 36,15 | 173,2 | — 277,12 | — 6261,18 | 57,84 | ||||
1,6 | 36,15 | 509,8 | — 1,6 | — 23,15 | 90,2 | — 144,32 | — 2088,13 | 37,04 | ||||
Итого: | — 4829,8 | — 98 283,3 | 1894,15 | |||||||||
Тогда
Таким образом, значение линейного коэффициента корреляции = -0,84 свидетельствует о наличии обратной и тесной связи между временем эксплуатации и ценой автомобиля.
Таким образом, значение линейного коэффициента корреляции = -0,63 свидетельствует о наличии обратной и тесной связи между пробегом и ценой автомобиля.
Таким образом, значение линейного коэффициента корреляции = 0,89 свидетельствует о наличии прямой и тесной связи временем эксплуатации и пробегом автомобиля.
Проведем анализ матрицы парных коэффициентов корреляции:
Составим матрицу парных коэффициентов корреляции:
Y | X1 | X2 | ||
Y | — 0,84 | — 0,63 | ||
X1 | — 0,84 | 0,89 | ||
X2 | — 0,63 | 0,89 | ||
Так как оба условия не соблюдаются, то для составления уравнения регрессии будем использовать наиболее значимый (весомый) факторный признак, т. е. — X1 (время эксплуатации), т.к. .
Составим уравнение регрессии:
В качестве регрессионной модели выберем линейную модель, которая имеет вид:
Вычислим коэффициенты регрессионного уравнения:
Таким образом, уравнение регрессии примет вид:
Заключение
В ходе исследования были выявлены следующие характеристики взаимосвязи стоимости автомобиля с факторными признаками:
· Стоимость автомобиля линейно зависит от пробега и времени эксплуатации причем эта зависимость обратная для обоих случаев. При увеличении пробега (времени эксплуатации) стоимость автомобиля уменьшается;
· Основным фактором, влияющим на конечную стоимость, является время эксплуатации;
· Выявлена зависимость стоимости автомобиля от времени эксплуатации, которая имеет следующий вид:
Список источников
1) Сайт www.auto.ru.
2) Ефимова М. Р., Ганченко О. И., Петрова Е. В. Практикум по общей теории статистики: Учеб. пособие. — 2-е изд., перераб. и доп. — М.: Финансы и статистика, 2005. — 336 с: ил. ISBN 5−279−2 555−0.