Основы корреляционного анализа

Содержание

Слайд 2

План лекции: Виды зависимостей и способы их представления Задачи корреляционного анализа

План лекции:

Виды зависимостей и способы их представления
Задачи корреляционного анализа
Корреляция рангов
Коэффициент ассоциации

(тетрахорический показатель связи)
Слайд 3

Виды зависимостей При функциональных зависимостях каждому значению одной переменной величины соответствует

Виды зависимостей

При функциональных зависимостях каждому
значению одной переменной величины соответствует
одно

вполне определенное значение другой
переменной (функции).

Корреляционные (статистические) связи
характеризуются тем, что численному
значению одной переменной соответствует много
значений (распределение) другой переменной.

Слайд 4

Изучение корреляционных зависимостей Табличный метод а) для небольшого количества измерений, не сгруппированных в классы

Изучение корреляционных зависимостей

Табличный метод
а) для небольшого количества измерений, не сгруппированных

в классы
Слайд 5

Табличный метод б) для большого количества измерений

Табличный метод
б) для большого количества измерений

Слайд 6

Графический метод Аналитический метод ( в виде математической формулы) У У Х Х r=0 r=+0,5

Графический метод

Аналитический метод
( в виде математической формулы)

У

У

Х

Х

r=0

r=+0,5

Слайд 7

ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА Определение тесноты (степени сопряженности) между варьируемыми признаками Определение

ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА

Определение тесноты (степени сопряженности) между варьируемыми признаками
Определение формы

и направления связи
КОРРЕЛЯЦИЯ бывает: положительной (прямой) и отрицательной (обратной)
По форме – линейной и нелинейной.
Слайд 8

Нахождение коэффициента корреляции ковариация для выборки из n опытов

Нахождение коэффициента корреляции

ковариация

для выборки из
n опытов

Слайд 9

коэффициент корреляции так как и то На практике коэффициент корреляции считают по формуле:

коэффициент корреляции

так как

и

то

На практике коэффициент корреляции считают по
формуле:

Слайд 10

Если r 0,3 ≤ r ≤ 0,5 – связь умеренная; 0,5

Если
r < 0,3 – связь слабая;
0,3 ≤ r ≤ 0,5

– связь умеренная;
0,5 ≤ r ≤ 0,7 – связь значительная;
0,7 ≤ r ≤ 0,9 – связь сильная;
r = 0 – связь отсутствует;
r = 1 – связь функциональная.

Пример: Определить наличие связи между весом обезьян и весом их детенышей. Оценить достоверность полученных результатов.

Слайд 11

Слайд 12

r > 0,5 – связь значительная t0.95;20=2,1 tэксп > tтабл связь

r > 0,5 – связь значительная

t0.95;20=2,1

tэксп > tтабл связь достоверна,

т.е. между
весом матери и весом детеныша
существует прямая значительная связь.
Слайд 13

КОРРЕЛЯЦИЯ РАНГОВ rp - коэффициент Спирмена для непараметрических показателей. d=xρ- yρ

КОРРЕЛЯЦИЯ РАНГОВ

rp - коэффициент Спирмена для непараметрических показателей.
d=xρ- yρ ;

n – объем выборки.

Коэффициент достоверности (для числа пар рангов больше 9):

Слайд 14

Пример: Оценить связь между окрасом и агрессивностью лис. Агрессивность: 1 –

Пример: Оценить связь между окрасом и агрессивностью лис.

Агрессивность: 1 – слабая;

8 – сильная.
Окрас: 1 – худший; 8 – лучший.
Слайд 15

Вывод: с вероятностью большей 0,95 можно сказать, что между окрасом лис

Вывод: с вероятностью большей 0,95 можно сказать, что между окрасом лис

и их агрессивностью существует прямая положительная связь
Слайд 16

КОЭФФИЦИЕНТ АССОЦИАЦИИ (тетрахорический показатель связи) Используется, когда связь устанавливается только по

КОЭФФИЦИЕНТ АССОЦИАЦИИ (тетрахорический показатель связи)

Используется, когда связь устанавливается только по наличию

или отсутствию признака.

a – особи, имеющие оба признака (++);
b – особи, имеющие первый признак, но не имеющие второго (+-);
c – особи, имеющие второй признак, но не имеющие первого (-+);
d – особи, не имеющие обоих признаков (--).

Слайд 17

ПРИМЕР: При проверке действия прививки против сыпного тифа получены первичные материалы

ПРИМЕР: При проверке действия прививки против сыпного тифа получены первичные материалы

о числе заболевших (-) и не заболевших (+) из числа получивших (+) и не получивших (-) прививку. Оценить достоверность связи
Слайд 18

Достоверность определяется по критерию χ2++=n·r2++=210·0,2052=8,83 Для числа степеней свободы ν=2-1 =1и

Достоверность определяется по критерию χ2++=n·r2++=210·0,2052=8,83
Для числа степеней свободы ν=2-1 =1и Р=0,95

табличное значение χ2++=3,8.
Т.е. связь между прививкой и не заболеванием брюшным тифом прямая и достоверная.