Статистики связи для порядковых и качественных признаков
В табл. 7.12 во второй и третьей графе для каждого признака записывают по три числа: эмпирическую частоту, теоретическую частоту и разность между эмпирическими и теоретическими частотами. Теоретические частоты определяются по формуле и, у = (nrnj)/n, где п — общее число данных. Например, для второй строки признака В теоретическая частота равна п = (50−30)/100 = 15; для второй строки признака… Читать ещё >
Статистики связи для порядковых и качественных признаков (реферат, курсовая, диплом, контрольная)
В горно-промышленной геологии встречается немало задач, в которых необходимо оценить тесноту зависимости между признаками, нс поддающимися количественному измерению, например, между двумя элементами, содержания которых оценены значениями не обнаружено, следы, < 0,001, или установить, есть ли связь между ориентацией магнитной аномалии (меридиональная, северо-восточная, широтная, северо-западная и т. и.) и природой возмущающего объекта (рудная, нерудная).
В первом случае рассматриваются два признака, каждый из которых может быть упорядочен по своим значениям, т. е. расположен в порядке возрастания или убывания этих значений. Во втором случае возможно только сгруппировать объекты изучения по принадлежности к гой или иной качественной группе (ориентировке, рудоносности). Мерой связи для зависимостей первого вида является показатель корреляции рангов р, для второго — коэффициент взаимной сопряженности к.
Корреляция рангов. Совокупность будет называться ранжированной, если пронумеровать объекты, упорядоченные по какому-либо признаку.
Пример 1. В результате анализа шести проб гранодиоригов получены следующие значения содержаний элемента Л (%): 0,7; 0,5; 0,6; 0,2; 0,4; 0,8. Расположив их в порядке возрастания и пронумеровав, получим ранжированную совокупность: признака X (численным или качественным), то их предварительно располагают один за другим, а затем каждому присваивают ранг, равный среднему арифметическому их предварительных рангов.
ранг | ранг | ||
0,2. | 0,6. | ||
0,4. | 0,7. | ||
0,5. | 0,8. | ||
Если среди объектов. | есть несколько,. | обладающих одним. | и тем же значением. |
Пример 2. Совокупность 0,3; 0,1; 0.4; 0,6; 0,2; 0,3; 0,5; 0,3; 0,4; 0,6 расположим в порядке возрастания: 0,1; 0,2; 0,3; 0,3; 0,3; 0,4; 0,4; 0,5; 0,6; 0,6. Так как значение 0,3 занимает 3, 4 и 5 места, то ранг для 0,3 определим равным (3 + + 4 + 5) / 3 = 4. Аналогично для значения 0,4 ранг будет равен (6 + 7) / 2 = 6,5, а для 0,6 — 9,5. Окончательно ранжированная совокупность будет иметь вид:
признак | ранг | признак | ранг |
0,1. | 0,4. | 6,5. | |
0,2. | 0,4. | 6,5. | |
0,3. | 0,5. | ||
0,3. | 0,6. | 9,5. | |
0,3. | 0,6. | 9,5. |
Теснота связи для порядковых признаков характеризуется показателем корреляции рангов, который определяется по формуле:
где (/-разность между рангом признакаXи рангом соответствующего ему признака Y; п — объем совокупности (число пар значений х, и_>>,•).
Показатель корреляции рангов изменяется в пределах 1 < р < 1. Как и в случае линейной корреляции, при р = 0 связь между признаками отсутствует, а при р = ±1 — функциональная. Значение р > 0 свидетельствует о прямой зависимости между изучаемыми признаками, р < 0 — обратной.
Пример 3. В табл. 8.3.4 приведены содержания элементов А и В в десяти пробах пород по данным полуколичественного спектрального анализа. Определить тесноту связи между содержаниями изучаемых элементов.
Коэффициент ранговой корреляции р = 1 — [6 — 43,0/10(100 — 1)] = 0,74. Распределение коэффициента ранговой корреляции близко к нормальному с основной ошибкой Sp — 1/7(71 — 3).
Оценка значимости р проводится методами, аналогичными оценке обычного коэффициента корреляции г.
Пример 4. Оценить значимость коэффициента ранговой корреляции, полученного в предыдущем примере. Принимаем а = 0,05; Sp = 1 /J (n — 3) = 0,38; / = 0,74 / 0,38 = 1,95. Так как < /0,05 = 2,37, то говорить о наличии связи между элементами нет оснований, хотя таковая, возможно, и существует (малое количество данных, слишком велика допустимая случайная ошибка).
Исходные данные и схема вычислений
Содержание элементов. | Ранг. | Взвешенный ранг. | Разность рангов. | ||||
А | В | R, | Ви | В л | В л | И. | «2 |
Не обн. | Следы. | 1,5. | 4.0. | 2,5. | 6,25. | ||
0,001. | 0.001. | 9,5. | 7,0. | 2,5. | 6,25. | ||
Следы. | Следы. | 4,0. | 4,0. | ||||
0,001. | Следы. | 7,0. | 4,0. | 3,0. | 9,0. | ||
Не обн. | Не обн. | 1,5. | 1,5. | ||||
Следы. | Не обн. | 4,0. | 1,5. | 2,5. | 6,25. | ||
0,001. | 0,001. | 7,0. | 7,0. | ||||
0,001. | 0,001. | 9,5. | 9,5. | ||||
Следы. | 0.001. | 4.0. | 7,0. | 3,0. | 9,0. | ||
0,001. | 0,001. | 7,0. | 9,5. | 2,5. | 6,25. | ||
Сумма | 43,00. |
Коэффициент взаимной сопряженности. Рассмотрим зависимость между двумя качественными признаками А и В, которые принимают следующие значения: Ли А2, А," и В1, В2, В,. Мерой зависимости между А и В будет коэффициент.
взаимной сопряженности, вычисляемый по формуле:
где К — коэффициент взаимной сопряженности; и — число проб; т — число градаций признака А; I — число градаций признака В: х2 = Х (и, у — п^/п,/, щ — эмпирические, а щ — теоретические частоты появления объектов, обладающих значениями признаков А" и В/.
Пример. Определить тесноту связи между характером возмущающего объекта магнитной аномалии (признак А) и характером гравитационного поля (признак В). Признак А принимает значения: А — нерудная аномалия, /Ь — рудная. Признак В: В — огрицатсльныс значения, Вг — ступень, В} - положительные значения приращений силы тяжести. Результаты изучения 100 участков выглядят следующим образом:
А,. | Аг | И/. | |
В | |||
Вг | |||
By | |||
П; |
Для вычисления коэффициента взаимной сопряженности целесообразно составить вспомогательную таблицу (табл. 8.3.5).
В табл. 7.12 во второй и третьей графе для каждого признака записывают по три числа: эмпирическую частоту, теоретическую частоту и разность между эмпирическими и теоретическими частотами. Теоретические частоты определяются по формуле и, у = (nrnj)/n, где п — общее число данных. Например, для второй строки признака В теоретическая частота равна п = (50−30)/100 = 15; для второй строки признака Вг пг = (50−40)/100 = 20 и т. д. Если сумма разностей теоретических и эмпирических частот по строкам и графам равна нулю, то вычисления проведены правильно. Далее определяем значение Таблица 8.3.5.
Расположение признаков для вычисления коэффициента взаимной сопряженности
Гпш)ации признака | А, | Аг | н. |
в,. | |||
— 10. | |||
Вг | |||
В | |||
— 10. | |||
пА |
и коэффициент взаимной сопряженности по формуле:
Значимость коэффициента взаимной сопряженности оценивается с помощью таблицы значений ур (табл. 8.3.6) при имеющемся числе степеней свободы /= (т — 1)(1 — 1). В нашем случае/= (2 — 1)(3 — 1) = 2 и /2о.05= 5,99. Вычисленное значение /o.os больше табличного, и можно утверждать, что между характером возмущающего объекта и характером гравитационного поля существует определенная связь.
Значения критерия'/
Таблица 8.3.6.
Уровень значимости. | Число степеней свободы f | ||||||
0,20. | 1,642. | 3,219. | 4,642. | 5,989. | 7,289. | 8,558. | 9,803. |
0,10. | 2,706. | 4,605. | 6,251. | 7,779. | 9,236. | 10,645. | 12,017. |
0,05. | 3,841. | 5,991. | 7,815. | 9,488. | 11,070. | 12,592. | 14,067. |