Дипломы, курсовые, рефераты, контрольные...
Срочная помощь в учёбе

Критерии согласия. 
Критерии согласия

РефератПомощь в написанииУзнать стоимостьмоей работы

Наряду с количественными статистическими критериями для определения типа распределения по выборочным данным используются графические методы. Простейший способ — построение по имеющейся выборке гистограммы относительных частот и на том же графике и в том же масштабе, — кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров. Значительные… Читать ещё >

Критерии согласия. Критерии согласия (реферат, курсовая, диплом, контрольная)

При анализе вариационных рядов распределения большое значение имеет, насколько эмпирическое распределение признака соответствует нормальному. Для этого частоты фактического распределения нужно сравнить с теоретическими, которые характерны для нормального распределения. Значит, нужно по фактическим данным вычислить теоретические частоты кривой нормального распределения, являющиеся функцией нормированных отклонений.

Иначе говоря, эмпирическую кривую распределения нужно выровнять кривой нормального распределения.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Критерием согласия называют критерий, который позволяет установить, является ли расхождение эмпирического и теоретического распределений случайным или значимым, т. е. согласуются ли данные наблюдений с выдвинутой статистической гипотезой или не согласуются. Распределение генеральной совокупности, которое она имеет в силу выдвинутой гипотезы, называют теоретическим.

Возникает необходимость установить критерий (правило), которое позволяло бы судить, является ли расхождение между эмпирическим и теоретическим распределениями случайным или значимым. Если расхождение окажется случайным, то считают, что данные наблюдений (выборки) согласуются с выдвинутой гипотезой о законе распределения генеральной совокупности и, следовательно, гипотезу принимают; если же расхождение окажется значимым, то данные наблюдений не согласуются с гипотезой и ее отвергают.

Обычно эмпирические и теоретические частоты различаются в силу того, что:

  • · расхождение случайно и связано с ограниченным количеством наблюдений;
  • · расхождение неслучайно и объясняется тем, что статистическая гипотеза о том, что генеральная совокупность распределена нормально — ошибочна.

Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой при выравнивании ряда гипотезы о характере распределения в эмпирическом ряду.

Эмпирические частоты получают в результате наблюдения. Теоретические частоты рассчитывают по формулам.

Для закона нормального распределения их можно найти следующим образом:

критерий согласие закон мендель.

  • · Уѓi—сумма накопленных (кумулятивных) эмпирических частот
  • · h — разность между двумя соседними вариантами
  • · у — выборочное среднеквадратическое отклонение
  • · t-нормированное (стандартизированное) отклонение
  • · ц (t)-функция плотности вероятности нормального распределения (находят по таблице значений локальной функции Лапласа для соответствующего значения t)
Критерии согласия. Критерии согласия.

Имеется несколько критериев согласия, наиболее распространенными из которых являются: критерий хи-квадрат (Пирсона), критерий Колмогорова, критерий Романовского.

Критерий согласия Пирсона ч2 — один из основных, который можно представить как сумму отношений квадратов расхождений между теоретическими (fТ) и эмпирическими (f) частотами к теоретическим частотам:

  • · k-число групп, на которые разбито эмпирическое распределение,
  • · fi-наблюдаемая частота признака в i-й группе,
  • · fT-теоретическая частота.

Для распределения ч2 составлены таблицы, где указано критическое значение критерия согласия ч2 для выбранного уровня значимости б и степеней свободы df (или н).

Уровень значимости б — вероятность ошибочного отклонения выдвинутой гипотезы, т. е. вероятность того, что будет отвергнута правильная гипотеза. Р — статистическая достоверность принятия верной гипотезы. В статистике чаще всего пользуются тремя уровнями значимости:

б=0,10, тогда Р=0,90 (в 10 случаях из 100).

б=0,05, тогда Р=0,95 (в 5 случаях из 100).

б=0,01, тогда Р=0,99 (в 1 случае из 100) может быть отвергнута правильная гипотеза Число степеней свободы df определяется как число групп в ряду распределения минус число связей: df = kz. Под числом связей понимается число показателей эмпирического ряда, использованных при вычислении теоретических частот, т. е. показателей, связывающих эмпирические и теоретические частоты. Например, при выравнивании по кривой нормального распределения имеется три связи. Поэтому при выравнивании по кривой нормального распределения число степеней свободы определяется как df =k-3. Для оценки существенности, расчетное значение сравнивается с табличным ч2табл При полном совпадении теоретического и эмпирического распределений ч2=0, в противном случае ч2>0. Если ч2расч> ч2табл, то при заданном уровне значимости и числе степеней свободы гипотезу о несущественности (случайности) расхождений отклоняем. В случае, если ч2расч50), при этом, частота каждой группы должна быть не менее 5.

Критерий согласия Колмогорова основан на определении максимального расхождения между накопленными эмпирическими и теоретическими частотами:

Критерии согласия. Критерии согласия.

где D и d — соответственно, максимальная разность между накопленными частотами и накопленными частостями эмпирического и теоретического распределений.

По таблице распределения статистики Колмогорова определяют вероятность, которая может изменяться от 0 до 1. При Р (л)=1- происходит полное совпадение частот, Р (л)=0 — полное расхождение. Если величина вероятности Р значительна по отношению к найденной величине л, то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны, т. е. носят случайный характер.

Основное условие использования критерия Колмогорова — достаточно большое число наблюдений.

Критерий согласия Колмогорова. Рассмотрим как критерий Колмогорова (л) применяется при проверке гипотезы о нормальном распределении генеральной совокупности. Выравнивание фактического распределения по кривой нормального распределения состоит из нескольких этапов:

  • 1. Сравнивают фактические и теоретические частоты.
  • 2. По фактическим данным определяют теоретические частоты кривой нормального распределения, которая является функцией нормированного отклонения.
  • 3. Проверяют на сколько распределение признака соответствует нормальному.
Критерии согласия. Критерии согласия. Критерии согласия. Критерии согласия. Критерии согласия. Критерии согласия.

Для IV колонки таблицы:

В MS Excel нормированное отклонение (t) рассчитывается с помощью функции НОРМАЛИЗАЦИЯ. Необходимо выделить диапазон свободных ячеек по количеству вариант (строк электронной таблицы). Не снимая выделения, вызвать функцию НОРМАЛИЗАЦИЯ. В появившемся диалоговом окне указать следующие ячейки, в которых размещены, соответственно, наблюдаемые значения (Xi), средняя (X) и среднеквадратическое отклонение ?. Операцию обязательно завершить одновременным нажатием клавиш Ctrl+Shift+Enter.

Для V колонки таблицы:

Функцию плотности вероятности нормального распределения ц (t) находим по таблице значений локальной функции Лапласа для соответствующего значения нормированного отклонения (t).

Для VI колонки таблицы:

Критерии согласия. Критерии согласия.

Критерий согласия Колмогорова (л) определяется путем деления модуля max разности между эмпирическими и теоретическими кумулятивными частотами на корень квадратный из числа наблюдений:

Критерии согласия. Критерии согласия.

По специальной таблице вероятности для критерия согласия л определяем, что значению л=0,59 соответствует вероятность 0,88 (л.

Распределение эмпирических и теоретических частот, плотности вероятности теоретического распределения.

Критерии согласия. Критерии согласия.

Применяя критерии согласия для проверки соответствия наблюдаемого (эмпирического) распределения теоретическому, следует различать проверку простых и сложных гипотез.

Одновыборочный критерий нормальности Колмогорова-Смирнова основан на максимуме разности между кумулятивным эмпирическим распределением выборки и предполагаемым (теоретическим) кумулятивным распределением. Если D статистика Колмогорова-Смирнова значима, то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.

Критерии согласия основаны на использовании различных мер расстояний между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности.

Критерий согласия Колмогорова Критерий Смирнова Критерий омега квадрат Перечисленные критерии были разработаны для проверки согласия с полностью известным теоретическим распределением. Расчетные формулы, таблицы распределений и критических значений широко распространены. Основная идея критериев Колмогорова, омега квадрат и аналогичных им состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения. Различаются эти критерии видом расстояний в пространстве функций распределения Законы Менделя это принципы передачи наследственных признаков от родительских организмов к их потомкам, вытекающие из экспериментов Грегора Менделя. Эти принципы послужили основой для классической генетики и впоследствии были объяснены как следствие молекулярных механизмов наследственности Пример. В некоторых классических экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, получаемых при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Они приводятся ниже вместе с теоретическими вероятностями, вычисленными в соответствии с теорией наследственности Менделя.

Наряду с количественными статистическими критериями для определения типа распределения по выборочным данным используются графические методы. Простейший способ — построение по имеющейся выборке гистограммы относительных частот и на том же графике и в том же масштабе, — кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров. Значительные отклонения от нормальности (сильная асимметрия, бимодальность) легко обнаруживаются на графике.

Таким образом, критерии согласия основаны на использовании различных мер расстояния между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности. Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели.

Если для конкретной выборки мы отклоняем гипотезу о нормальности, и, следовательно, не имеем права пользоваться методами, основанными на нормальности, то для получения статистических выводов можно поступать разными способами. Например, если объем выборки достаточно велик, можно предпочесть использовать параметрические критерии как приближенные. Другой путь состоит в подборе замены переменной, приводящей к нормальному распределению[9]. Третий путь — применение непараметрических критериев.

Пример. Пусть получена следующая выборка 50 значений случайной величины с неизвестным распределением: (см. Таблица 1).

Проверим гипотезу о том, что эта случайная величина имеет нормальное распределение. После разбиения области изменения выборочных значений на 5 равных интервалов получаем следующие наблюденные и гипотетические частоты:(см. Приложения Таблица 2).

Гипотетические частоты вычислялись для нормального распределения с параметрами, оцененными по выборке — соответственно, число степеней свободы статистики критерия равно 5−1-2=2. Выборочное значение статистики равно, что не выходит за критический 5%-ный предел, равный. Следовательно, у нас нет оснований отвергнуть гипотезу о нормальности.

Критерии согласия. Критерии согласия.

В действительности, выборка была получена с помощью датчика случайных чисел, равномерно распределенных на отрезке [0, 100]. Т. е. мы видим, что при данном числе наблюдений (в общем-то, конечно, небольшом для проверки гипотезы о типе распределения) критерий не обнаруживает отклонения от нормальности в направлении равномерности.

Величина статистики одновыборочного критерия Колмогорова — Смирнова равна D=0.11, что также не выходит за 5%-ный предел этого критерия в предположении, что гипотетические средние равны выборочным. Однако в случае неизвестных параметров гипотетического нормального распределения лучше пользоваться модификацией критерия Колмогорова — Смирнова, предложенной Cтефенсом (Лиллифорсом). Но в этом случае значение.

Критерии согласия. Критерии согласия.

т.е. нет оснований отвергнуть гипотезу и по этому критерию.

Пример сравнения гистограммы и кривой нормальной плотности.

Рис. 1. Пример сравнения гистограммы и кривой нормальной плотности

Пример. Расчеты, аналогичные предыдущим, проведенные для выборки объема 150 значений случайной величины, равномерно распределенной на отрезке [0, 100], дали значение, что позволило отвергнуть гипотезу о нормальности на уровне значимости 5%. По критерию Колмогорова — Смирнова гипотеза отвергалась лишь на уровне 10%, а по критерию Лиллифорса — на уровне 1%, что показывает неправомочность применения критерия Колмогорова — Смирнова в данной ситуации.

Пример. Расчеты статистик критериев согласия для данных таблицы 1, содержащей 50 выборочных значений длины лепестка ириса разноцветного, приводят к значению статистики равному 2.1, и значению статистики, равному 0.117. В этом случае гипотеза о нормальности не отвергается ни критерием, ни критерием Колмогорова — Смирнова — Лиллифорса.

Пример. В некоторых классических экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, получаемых при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Они приводятся ниже вместе с теоретическими вероятностями, вычисленными в соответствии с теорией наследственности Менделя. (см. Приложения Таблица 3).

В этом случае теоретическое распределение дискретно и известно полностью. Для проверки согласия экспериментальных данных теоретическому распределению используем критерий для простой гипотезы. Значение статистики, вычисленное по выборке равно.

Критерии согласия. Критерии согласия.

что меньше 5%-ного критического значения.

Критерии согласия. Критерии согласия.

Следовательно, теория наследственности Менделя не противоречит полученным экспериментальным данным.

Наряду с количественными статистическими критериями для определения типа распределения по выборочным данным используются графические методы.

Простейший способ — построение по имеющейся выборке гистограммы относительных частот и на том же графике и в том же масштабе, — кривой плотности нормального распределения с выборочным средним и выборочной дисперсией в качестве параметров.

Закон Менделя.

Семена.

Наблюденная численность.

Ожидаемая численность.

Круглые и желтые.

Критерии согласия. Критерии согласия.

Морщинистые и желтые.

Критерии согласия. Критерии согласия.

Круглые и зеленые.

Морщинистые и зеленые.

Критерии согласия. Критерии согласия.

Всего.

Значительные отклонения от нормальности (сильная асимметрия, бимодальность) легко обнаруживаются на графике.

Пример: Применим этот прием к рассмотренной выше модельной выборке объема n=50, извлеченной из равномерного распределения. На рис. 7 приведена гистограмма и кривая нормальной плотности. Можно сказать, что визуально отклонение от нормальности в пользу равномерности заметно (хотя, как мы видели, статистически значимо при таком числе наблюдений оно не подтверждается).

С точки зрения визуального обнаружения отклонений от нормальности сравнение эмпирической и гипотетической функций распределения гораздо менее наглядно, чем сравнение гистограммы с графиком плотности. Однако обычно сравнивают на сами функции распределения, а обратные нормальные преобразования от них, так называемые пробит-графики. Пробит-график от теоретической нормальной функции распределения представляет собой прямую, а пробит-график эмпирической функции распределения тем ближе к прямой, чем ближе она к нормальной. Этот прием позволяет на первом этапе анализа данных выявить их особенности, выдвинуть гипотезы о характере распределения, решить вопрос о целесообразности замены переменной. (см. Приложения Рис. 1 Пример сравнения гистограммы и кривой нормальной плотности.).

Вывод

Критерии согласия основаны на использовании различных мер расстояния между анализируемым эмпирическим распределением и функцией распределения признака в генеральной совокупности. Критериями согласия называют статистические критерии, предназначенные для проверки согласия опытных данных и теоретической модели.

Существует несколько критерий согласия: критерий согласия Колмогорова и омега-квадрат, ч2 Пирсона, ч2 Фишера и другие. Состоятельность критериев Колмогорова и омега-квадрат означает, что любое отличие распределения выборки от теоретического будет с их помощью обнаружено, если наблюдения будут продолжаться достаточно долго. Практическую значимость свойства состоятельности не велика, так как трудно рассчитывать на получение большого числа наблюдений в неизменных условиях, а теоретическое представление о законе распределения, которому должна подчиняться выборка, всегда приближённое. Поэтому точность статистических проверок не должна превышать точность выбранной модели.

  • 1. Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере /Под ред. В. Э. Фигурнова. — 3-е изд., перераб. и доп. — М.:ИНФРА — М. 2003. — 544 с., ил.
  • 2. Электронный учебник по дисциплине «Математическая статистика» В. В. Шеломовский, Мурманский федеральный государственный педагогический университет. http://www.exponenta.ru/educat/systemat/shelomovsky/lab/lab14.asp
  • 3. Тюрин Ю. Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. … д-ра физ.-мат. наук. — М., 1985. — 33 с. — (МГУ).
  • 4. Лемешко Б. Ю., Постовалов С. Н. О зависимости предельных распределений статистик Пирсона и отношения правдоподобия от способа группирования данных // Заводская лаборатория. 1998. — Т. 64. — № 5. — С.56−63.
Показать весь текст
Заполнить форму текущей работой