Коэффициент детерминации.
Корреляционное отношение.
Индекс корреляции
Для измерения степени тесноты количественных переменных помимо коэффициентов корреляции используются коэффициент детерминации, корреляционное отношение и индекс корреляции. Эти меры определены для любой формы связи: при линейной или нелинейной зависимости и для признаков, не имеющих совместного нормального распределения. Формально они определяются с помощью общей (полной) дисперсии aj, признака… Читать ещё >
Коэффициент детерминации. Корреляционное отношение. Индекс корреляции (реферат, курсовая, диплом, контрольная)
Для измерения степени тесноты количественных переменных помимо коэффициентов корреляции используются коэффициент детерминации, корреляционное отношение и индекс корреляции. Эти меры определены для любой формы связи: при линейной или нелинейной зависимости и для признаков, не имеющих совместного нормального распределения. Формально они определяются с помощью общей (полной) дисперсии aj, признака/: + о;?,.
где о} — дисперсия функции регрессии Дх) относительно математического ожидания у; of — дисперсия ошибки наблюдения, которая характеризует разницу между эмпирическими значениями у, — и расчетными значениями Дх,).
Тогда коэффициент детерминации равен.
Его величина показывает, какая доля общей дисперсии признака у определяется (детерминируется) дисперсией функции регрессии. Оставшаяся доля общей дисперсии, т. е. ,.
объясняется действием неконтролируемых факторов («помехи») и определяет верхнюю границу точности предсказания у по х.
При нелинейной форме связи показательназывается корреляционным отношением.
Индекс корреляции 1ух характеризует тесноту парной связи. Он является величиной неотрицательной. Свойства индекса корреляции во многом похожи на свойства коэффициента корреляции, при этом 0<|р|</<sub>у|х <1. Если 1ух =|р|, то имеет место точная линейная корреляционная зависимость. В случае 1ух = 1, т. е. при су. = 0, отсутствует влияние прочих факторов и все распределение сконцентрировано на кривой регрессии, между у и х присутствует функциональная зависимость. При 1ух=0 связь полностью отсутствует (су = 0).
Если для линейных регрессий знак коэффициента корреляции связан с наклоном прямой, то знак индекса корреляции, используемого также и для нелинейных регрессий, не интерпретируется.
Более высокое значение индекса корреляции по сравнению с величиной коэффициента корреляции свидетельствует о том, что подгонка кривой имеет преимущества по сравнению с прямой линией, т. е. регрессия нелинейная.
Оценка индекса корреляции. Если уравнение регрессии у = Дх) предварительно оценено по выборке, то оценкой квадрата индекса корреляции служит величина.
где Sj — оценка дисперсии о^; S^CT — остаточная дисперсия значений у, относительно модели регрессии Дх); Sj — оценка общей дисперсии отклика у.
Для сгруппированных данных, например при использовании корреляционной таблицы, оценкой дисперсии aj является выборочная дисперсия.
где К — число интервалов группировки по х; nxj — частота попадания в j-й интервал по х; у, — среднее значение у в j-м интервале.
Тогда индекс корреляции вычисляется по формуле.
где S|CT — остаточная дисперсия относительно у (х).
Для характеристики силы связи по значениям г или 1ух используется шкала Чеддока [16] (табл. 9.1).
Таблица 9.1
Шкала Чеддока.
Значения | г | или 1у|Х | ОД—0,3. | 0,3—0,5. | СП. о. |
о. NO. | 0,9—0,99. |
Сила связи. | Слабая. | Умеренная. | Заметная. | Высокая. | Весьма высокая. |
При значениях /. ниже 0,7 величина коэффициента детерминации Ц.|v всегда будет меньше 50%, т. е. менее половины общей дисперсии признака у определяется дисперсией функции регрессии. Такие модели связи не имеют практического значения. При значениях I ^ выше 0,9 сила связи является весьма высокой и ее модель можно использовать на практике.