Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Корреляционный анализ. 
Статистика

РефератПомощь в написанииУзнать стоимостьмоей работы

Множественный коэффициент корреляции изменяется в пределах 0 Приближение R к единице свидетельствует о сильной зависимости между признаками. Иначе говоря, среди отобранных факторов присутствуют те, которые решающим образом влияют на результативный показатель. Малое значение множественного коэффициента корреляции можно объяснить тем, что в уравнение множественной регрессии не включены факторы… Читать ещё >

Корреляционный анализ. Статистика (реферат, курсовая, диплом, контрольная)

Корреляционный анализ дает ответ на вопрос, насколько хорошо приближает наши данные выбранная модель.

Поведение результативного показателя может быть обусловлено влиянием одного (парная регрессия) или многих факторов (множественная регрессия).

В качестве показателей тесноты связи межу количественными признаками наиболее часто используются линейный коэффициент корреляции, корреляционное отношение (эмпирическое и теоретическое), коэффициенты корреляции рангов, коэффициент конкордации.

Начнем рассмотрение с анализа линейных связей, когда поведение результативного показателя обусловлено влиянием одного фактора (парная линейная регрессия).

Парная линейная регрессия.

Проведена случайная выборка. При значениях факторного показателя х1у х2, х3,…, хп наблюдались значения результативного показателя ух, у2, у3,…, уп соответственно.

п

1>,•.

Среднее значение результативного показателя у =——.

п

В каждой точке xi фактическое значение результативного показателя отклоняется от среднего значения на величину yi — у.

Мы предположили, что поведение результативного показателя у обусловлено влиянием факторного показателя х и аналитически связь между ними описывается уравнением прямой линии: у-а+Ьх.

Для измерения тесноты связи между двумя количественными признаками х и у в случае линейной зависимости между ними используется линейный коэффициент корреляции. Если форма связи между признаками х и у еще не определена, то линейный коэффициент корреляции рассчитывают, чтобы ответить на вопрос, можно ли считать зависимость между ними линейной.

Возведя линейный коэффициент корреляции в квадрат, получим коэффициент детерминации, показывающий величину вариации переменной у, которая объясняется переменной х при наличии линейной связи этих величин.

В параграфе 5.2 было введено понятие коэффициента детерминации и отмечалось, что он показывает, какая доля в общей дисперсии приходится на дисперсию, обусловленную вариацией признака, положенного в основу группировки.

В случае парной линейной регрессии факторным признаком является .г, результативным признаком является у.

Теоретические значения результативного показателя, полученные по выбранному уравнению регрессии в каждой точке х{, отклоняются от среднего уровня на величину ух-у. Данное отклонение обусловлено влиянием фактора х.

Но на поведение у помимо фактора х оказывают влияние и другие факторы, влияние которых скрыто в остатке 8. Фактическое значение результативного показателя yt —yi +8;. В каждой точке лг, — отклонение фактических значений результативного показателя от теоретических значений, полученных по выбранному уравнению регрессии, равно г/; г

Таким образом, отклонение фактических значений результативного показателя от среднего уровня складывается из двух составляющих: у{ —у— (г/, -у) + (у-у)> ЧТ () представлено на рис. 9.2.

Итак, для каждой точки х{.

п

• XO/j 2 ~ сумма квадратов общей вариации результативного по;

;=1.

казателя у n

* XXi/; ~У)2 ~ сумма квадратов вариации результативного показателя у,

i=1.

которая объясняется влиянием факторах, т. е. уравнением у=а+Ьх-,

П

• ~У)2 ~ сумма квадратов вариации результативного показателя у,

/=1.

которая не объясняется уравнением у=а+Ьх, она связана с влиянием факторов, не включенных в модель парной линейной регрессии.

Вариация результативного показателя у.

Рис. 9.2. Вариация результативного показателя у.

Чем выше доля объясненной вариации в общей вариации результативного показателя, тем лучше приближает наши данные линейная модель.

Дисперсия, отражающая ту часть вариации результативного признака у, которая обусловлена воздействием факторного признака х, равна.

Корреляционный анализ. Статистика.

Дисперсия, отражающая ту часть вариации результативного признака у, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора х, равна Корреляционный анализ. Статистика.

Общая дисперсия равна.

Корреляционный анализ. Статистика.

Коэффициент детерминации г2, показывающий долю вариации результативного признака у, которая объясняется влиянием факторного признака х, равен.

Корреляционный анализ. Статистика.

Значение коэффициента детерминации лежит в пределах от нуля до единицы. В случае строгой линейной зависимости между х и у коэффициент детерминации равен единице. Если зависимость между х и у отсутствует, коэффициент детерминации равен нулю. Чем теснее связь между х и у, тем ближе значение коэффициента детерминации к единице и тем выше точность прогноза по модели парной линейной регрессии.

Наряду с коэффициентом детерминации при наличии линейной связи между двумя коррелируемыми признаками рассчитывают линейный коэффициент корреляции г.

Корреляционный анализ. Статистика.

Линейный коэффициент корреляции лежит в пределах —1 <�г < 1.

Чаше всего рассчитывается линейный коэффициент корреляции по формуле (9.5). Коэффициент детерминации рассчитывают путем возведения в квадрат коэффициента корреляции.

Линейный коэффициент корреляции характеризует тесноту и направление связи между х и у.

Знак линейного коэффициента корреляции характеризует направление связи. В случае прямой связи между х и у линейный коэффициент корреляции имеет положительное значение, в случае обратной связи между х и у — отрицательное. Знак линейного коэффициента корреляции совпадает со знаком коэффициента регрессии Ь.

Величина линейного коэффициента корреляции характеризует тесноту связи. Чем ближе линейный коэффициент корреляции по модулю к единице, тем ближе связь между х и у к линейной. При значении линейного коэффициента корреляции, равном нулю, линейной связи между х и у ие существует, однако между х и у может существовать другая (нелинейная) зависимость.

Пример 9.3. Рассчитаем линейный коэффициент корреляции и коэффициент детерминации для задачи, исходные данные которой даны в примере 9.1.

Решение

Для определения линейного коэффициента корреляции в дополнение к данным, представленным в табл. 9.3, необходимо рассчитать величину X г/2. Обобщим данные, необходимые для расчета, в табл. 9.5.

Данные, отражающие зависимость доходности акции от среднерыночной доходности.

Таблица 9.5

Номер периода.

Доходность акции у, %

Среднерыночная доходность х, %

X2

ху

У2

Сумма.

2> = 95.

2> = 76.

YjX2 =814.

?at/ = 1006.

1>2 = 1279.

Коэффициент корреляции:

Корреляционный анализ. Статистика.

Коэффициент детерминации: г2 =0,882 =0,774.

Значение линейного коэффициента корреляции близко к единице, что свидетельствует о сильной положительной связи между х и у (с ростом среднерыночной доходности доходность акции исследуемой компании растет). Обратим внимание на совпадение знаков линейного коэффициента корреляции и коэффициента b полученного выше уравнения регрессии у = а + bx = 1,19 +1,125л:.

Коэффициент детерминации равен 0,774. Это означает, что 77,4% общей вариации доходности акции у зависит от среднерыночной доходности х. Наша модель нс объясняет 22,6% вариации доходности акции. Эта часть вариации объясняется факторами, не включенными в модель.

Расчет линейного коэффициента корреляции может быть произведен также по следующей формуле:

Корреляционный анализ. Статистика.

Пример 9.4. Для задачи, рассматриваемой в примерах 9.1, 9.3, определим линейный коэффициент корреляции по формуле (9.6).

Решение

Корреляционный анализ. Статистика.

Линейный коэффициент корреляции позволяет сделать вывод о наличии линейной связи. Однако между признаками может отсутствовать линейная связь, но существовать другая (нелинейная) зависимость. Определение линейного коэффициента корреляции г и коэффициента детерминации г2, рассчитываемых при наличии линейной связи признаков, не позволяет сделать вывод о наличии или отсутствии нелинейной зависимости между ними.

Универсальным показателем измерения тесноты связи, применяемым ко всем случаям корреляционной зависимости независимо от формы этой связи (в случае наличия линейной и нелинейной зависимости между двумя признаками), является корреляционное отношение. Различают эмпирическое и теоретическое корреляционное отношение.

В параграфе 5.2 было введено понятие эмпирического корреляционного отношения. Рассмотрим различие в определении эмпирического и теоретического корреляционных отношений.

Эмпирическое корреляционное отношение г| рассчитывается по данным группировки:

Корреляционный анализ. Статистика.

где а2)бщ — общая дисперсия; а2 — средняя из частных (внутригрупповых) дисперсий; 82 — межгрупповая дисперсия (дисперсия внутригрупповых средних), которая характеризует отклонения групповых средних результативного показателя от общей средней.

Все эти дисперсии есть дисперсии результативного признака:

Корреляционный анализ. Статистика.

где т — число групп, но факторному признаку х; п — число единиц совокупности; yj — средние значения результативного признака по группам; у — общее среднее значение результативного признака; у, — индивидуальные значения результативного признака; fj=fx — частота в j-й группе ж; fi=fy — частота в г-й группе у.

Квадрат корреляционного отношения г|2 =— называется эмпирическим коэффициентом детерминации. с

Теоретическое корреляционное отношение определяется, но формуле.

Корреляционный анализ. Статистика.

где 52 — дисперсия выравненных (теоретических) значений результативного признака, т. е. значений, рассчитанных по уравнению регрессии; а2 — дисперсия эмпирических (фактических) значений результативного признака. Корреляционное отношение изменяется в пределах от 0 до 1.

Пример 9.5. Определим теоретическое корреляционное отношение по данным табл. 9.5.

Решение

Исходные данные и расчет дополнительных показателей, необходимых для исчисления корреляционного отношения, представлены в табл. 9.6.

Таблица 9.6

Расчетная таблица для определения корреляционного отношения.

X

Доходность акции, %.

{у-у)2

(у-у)2

(у-у)2

фактическая у

теоретическая у

12,44.

0,15 625.

0,319 225.

0,1936.

14,69.

37,51 563.

7,924 225.

10,9561.

10,19.

8,265 625.

2,839 225.

1,4161.

12,44.

8,265 625.

0,319 225.

11,8336.

15,815.

37,51 563.

15,5236.

4,774 225.

16,94.

9,765 625.

25,65 423.

3,7636.

6,815.

15,1 563.

25,6036.

1,404 225.

5,69.

34,51 563.

38,25 423.

0,0961.

2> = 76.

Ну=95

НУ = 95,02.

Н (у-у)2 =

= 150,875.

Н (у-у)2 =

= 116,4376.

H (lУ-у)2 =

= 34,43 755.

Ранее было получено уравнение регрессии у =а+Ьх = 1,19 +1,125*. Подставляя в данное уравнение значения х, находим соответствующие им значения у (столбец 3 табл. 9.6).

? 95.

Среднее значение доходности акции: у=——=— = 11,875.

п 8.

Дисперсия эмпирических (фактических) значений результативного признака: Корреляционный анализ. Статистика. Дисперсия теоретических (выравненных) значений результативного признака: Корреляционный анализ. Статистика. Отсюда теоретическое корреляционное отношение.

I.

I.

Такой же результат получим, используя формулу г|тсор = J1—^L:

Корреляционный анализ. Статистика.

В данном примере, как мы видим, значение теоретического корреляционного отношения совпало со значением линейного коэффициента корреляции, так как было принято предположение о наличии линейной связи.

Мы рассмотрели линейную связь, но, как уже отмечалось, теоретическое корреляционное отношение, в отличие от линейного коэффициента корреляции, позволяет измерить тесноту зависимости при любой форме связи.

Для измерения тесноты связи при множественной корреляционной зависимости, т. е. при исследовании трех и более признаков одновременно, вычисляется множественный и частные коэффициенты корреляции.

Множественный коэффициент корреляции вычисляется при наличии линейной связи между результативным и несколькими факторными признаками, а также между каждой парой факторных признаков.

Множественный коэффициент корреляции для двух факторных признаков вычисляется по формуле.

Корреляционный анализ. Статистика.

где rf/Xj, i — 1,2, — парные коэффициенты корреляции между признаками:

Корреляционный анализ. Статистика.

Множественный коэффициент корреляции изменяется в пределах 0 Приближение R к единице свидетельствует о сильной зависимости между признаками. Иначе говоря, среди отобранных факторов присутствуют те, которые решающим образом влияют на результативный показатель. Малое значение множественного коэффициента корреляции можно объяснить тем, что в уравнение множественной регрессии не включены факторы, существенно влияющие на результативный показатель, либо тем, что установленная линейная форма зависимости не отражает реальной взаимосвязи признаков.

Множественный коэффициент корреляции зависит не только от корреляции результативного показателя с факторными, но и от корреляции факторных признаков между собой. Наличие между двумя факторами весьма тесной линейной связи (парный коэффициент корреляции превышает по абсолютной величине 0,8) называется коллинеарностью, а между несколькими факторами — мультиколлинеарностью.

Отсутствие корреляционной связи между факторными признаками и наличие тесной связи межу результативным и факторными признаками — условие включения этих факторных признаков в регрессионную модель.

Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками при фиксированном значении других факторных признаков, т. е. когда их влияние исключается.

В случае зависимости от двух факторных признаков коэффициенты частной корреляции имеют вид.

Корреляционный анализ. Статистика.

где гар — парные коэффициенты корреляции между указанными в индексе переменными (в первом случае исключено влияние факторного признака х2у во втором — хх).

Показать весь текст
Заполнить форму текущей работой