Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии

РефератПомощь в написанииУзнать стоимостьмоей работы

Таким образом, в рамках классической линейной регрессионной модели предположения теоремы Гаусса — Маркова об ошибках усиливаются следующим образом: е,-~ JV (0; a2), г = 1, п. Доказательство этого утверждения основано на том факте, что линейная комбинация нормально распределенных случайных величин также имеет нормальное распределение. Начнем с проверки гипотез о конкретном значении коэффициента… Читать ещё >

Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии (реферат, курсовая, диплом, контрольная)

Проверка гипотез о конкретном значении коэффициентов парной регрессии

В предыдущем параграфе, зная основные числовые значения ошибок, мы нашли основные числовые характеристики для МНК-оценок. Для того чтобы получить информацию о законе распределения этих оценок, необходимо предварительно сделать предположение о распределении ошибок.

Наиболее распространенное предположение, которое делается в рамках классической линейной регрессионной модели, состоит в том, что все ошибки имеют нормальное распределение. Теоретическим обоснованием такого предположения служит центральная предельная теорема (ЦПТ), упоминавшаяся в гл. 2. Напомним, что ошибки в, i = 1,…, п, отражают в парной ре;

л/.

грессии влияние всех остальных факторов, кроме X, т. е. е, = X г'т. Соглас;

т-1.

но ЦПТ если г1т независимы и одинаково распределены, то их сумма будет иметь нормальное распределение (вне зависимости от распределения z'm Vi), если М- достаточно велико. При этом условие ЦПТ об одинаковом распределении параметров может быть несколько ослаблено.

Таким образом, в рамках классической линейной регрессионной модели предположения теоремы Гаусса — Маркова об ошибках усиливаются следующим образом: е,-~ JV (0; a2), г = 1,п.

Утверждение 4.2. Если все ошибки имеют нормальное распределение с нулевым математическим ожиданием и одинаковой дисперсией, т. е. е,.~ N (0; а 1), i = 1,…, пу то МНК-оценки коэффициентов парной регрессии также имеют нормальное распределение, причем Р() ~ N (Р(); а^), р, ~ а^).

Доказательство этого утверждения основано на том факте, что линейная комбинация нормально распределенных случайных величин также имеет нормальное распределение.

Зная закон распределения оценок [30 и р, мы можем перейти к проверке гипотез. Общая схема такой проверки была описана в гл. 2. Напомним, что все гипотезы формулируются парами: основная гипотеза Я0 и альтернативная гипотеза Я,.

Начнем с проверки гипотез о конкретном значении коэффициента наклона (для свободного члена все результаты аналогичны). Основная гипотеза имеет следующий вид: Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии.

где Pj — конкретное число, например 0 или 5.

Альтернативная гипотеза может быть двусторонней: Я: р, ^ ру или одной из односторонних: Я: pt > ру или Я1: pt < ру.

При выборе тестовой статистики используются следующие соображения: если гипотеза Я0: Pj = РУ не отвергается, то pt ~ N (р,; ajj).

Pi — РУ Тогда статистика z =-имеет распределение Ar(0; 1). К сожалению,.

аР, в выражение для входит неизвестный параметр о2еУ поэтому вычислить эту статистику невозможно. Традиционный прием в таких случаях — замена неизвестного параметра а2 его оценкой а2, но в этом случае распределение статистики z уже не будет нормальным.

Выясним, каким же будет распределение статистики ————. Для этого.

1 °*.

воспользуемся следующими утверждениями1.

Утверждение 4.3. &2 = является несмещенной оценкой параметра a2 дисперсии ошибок.

ж, ^ «RSS

Утверждение 4.4. Величина —— для парной регрессии имеет распределение у?п_2.

Утверждение 4.5. Оценки (3, иае2 независимы.

Замечание 4.1. Оценки стандартных ошибок оценок коэффициентов регрессии ро и Pj вычисляются по формулам.

Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии.

и выдаются статистическими пакетами при оценке параметров регрессии.

Проведем некоторые преобразования статистики, в результате.

ае, которых выявим ее закон распределения:

Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии.

п ?? — Р?

Поскольку случайная величина —i-имеет стандартное нормальное.

аР,.

RSS

распределение, а случайная величина —— — распределение %1 2 и эти СЛУ" .

aPi.

чайные величины независимы (см. утверждение 4.5), то случайная величина —~ имеет распределение Стьюдента с (п — 2) степенями свободы.

aPi.

(см. определение 2.31).

Мы можем вернуться к проверке гипотезы о конкретном значении коэффициента наклона. Начнем с процедуры выбора между Н0 и Н{ при двусторонней альтернативной гипотезе и уровне значимости а:

п Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии. ", Р.-э?

В первую очередь вычисляем значение тестовой статистики t = —~-.

aPi.

Если это значение является «слишком большим», а именно, если > tffin — 2), то гипотеза Н0 отвергается в пользу гипотезы HvГрафически это можно изобразить следующим образом (рис. 4.1).

Если значение тестовой статистики попадает в заштрихованную область, то гипотеза Н0 отвергается. В противном случае (а именно, если И ^ *а/г (и «2), т. е. t попадает в незаштрихованную область) гипотеза Я() не отвергается.

Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии.

Аналогично проверяются и односторонние гипотезы. При выборе между гипотезами.

Критические области нормального распределения.

Рис. 4.1. Критические области нормального распределения.

р. — э? .

тестовая статистика t = —;-не изменяется, а правило выоора между ги;

потезами выглядит следующим образом: если t > t™l(n — 2) (это соответствует попаданию тестовой статистики в заштрихованную область на рис. 4.2), то гипотеза Н0 отвергается в пользу альтернативной.

В последнем случае неравенства меняются на противоположные. При выборе между гипотезами.

Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии.

р,-р?

тестовая статистика t = —-по-прежнему не меняется, а правило при;

аР.

нятия решений принимает следующий вид: если t < - 2) (в этом случае это соответствует попаданию тестовой статистики в заштрихованную область на рис. 4.3), то гипотеза Н0 отвергается в пользу альтернативной.

Правый хвост Рис. 4.3. Левый хвост.
Рис. 4.2. Правый хвост Рис. 4.3. Левый хвост нормального распределения нормального распределения.

Рис. 4.2. Правый хвост Рис. 4.3. Левый хвост нормального распределения нормального распределения.

Показать весь текст
Заполнить форму текущей работой