Коэффициент корреляции и корреляционный анализ

Содержание

Слайд 2

Основные понятия Коэффициент корреляции - это статистический показатель зависимости двух случайных

Основные понятия

Коэффициент корреляции - это статистический показатель зависимости двух случайных величин.
Корреляционный

анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами.
Слайд 3

Расчёт коэффициента корреляции Есть массив из n точек {x1,i, x2,i} Рассчитываются

Расчёт коэффициента корреляции

Есть массив из n точек {x1,i, x2,i}
Рассчитываются средние значения для каждого параметра:
И

коэффициент корреляции: 
r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна.
Слайд 4

Методами корреляционного анализа решаются следующие задачи: 1) Взаимосвязь. Есть ли взаимосвязь

Методами корреляционного анализа решаются следующие задачи:

1) Взаимосвязь. Есть ли взаимосвязь между

параметрами?
2) Прогнозирование. Если известно поведение одного параметра, то можно предсказать поведение другого параметра, коррелирующего с первым.
3) Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации.
Слайд 5

Свойства коэффициента корреляции: r изменяется в интервале от —1 до +1.

Свойства коэффициента корреляции:

r изменяется в интервале от —1 до +1.
Знак r означает, увеличивается ли

одна переменная по мере того, как увеличивается другая (положительный r), или уменьшается ли одна переменная по мере того, как увеличивается другая (отрицательный r).
Величина r величина указывает, как близко расположены точки к прямой линии. В частности, если r = +1 или r= —1, то имеется абсолютная (функциональная) корреляция по всем точкам, лежащим на линии (практически это маловероятно); если r=0 , то линейной корреляции нет (хотя может быть нелинейное соотношение). Чем ближе r к крайним точкам (±1), тем больше степень линейной связи.
Коэффициент корреляции r безразмерен, т. е. не имеет единиц измерения.
Слайд 6

Величина r обоснована только в диапазоне значений x и y в

Величина r обоснована только в диапазоне значений x и y в выборке. Нельзя заключить, что он будет

иметь ту же величину при рассмотрении значений x или y, которые значительно больше, чем их значения в выборке.
x и y могут взаимозаменяться, не влияя на величину.

Свойства коэффициента корреляции:

Слайд 7

Значения коэффициента корреляции Охарактеризовать силу корреляционной связи можно прибегнув к шкале

Значения коэффициента корреляции

Охарактеризовать силу корреляционной связи можно прибегнув к шкале

Челдока, в которой определенному числовому значению соответствует качественная характеристика. В случае положительной корреляции при значении:
0-0,3 – корреляционная связь очень слабая;
0,3-0,5 – слабая;
0,5-0,7 – средней силы;
0,7-0,9 – высокая;
0,9-1 – очень высокая сила корреляции
Слайд 8

Расчёт коэффициента корреляции в Excel Алгоритм: 1. Выбрать пустую ячейку, в

Расчёт коэффициента корреляции в Excel

Алгоритм: 1. Выбрать пустую ячейку, в которую будет

выведен результат расчетов.
2. Нажать в главном меню Excel пункт «Формулы».
3. Среди кнопок, сгруппированных в «Библиотеку функций», выбрать «Другие функции».
4. В выпадающих списках выбрать функцию расчета корреляции (Статистические — КОРРЕЛ).
5. В Excel откроется панель «Аргументы функции». «Массив 1» и «Массив 2» — это диапазоны сравниваемых данных. Для автоматического заполнения этих полей можно просто выделить нужные ячейки таблицы.
6. Нажать «ОК», закрыв окно аргументов функции. В ячейке появится подсчитанный коэффициент корреляции.
Слайд 9

Слайд 10

Слайд 11

Расчёт коэффициента корреляции в Mathcad 1. Задаём 2 массива (x и y)

Расчёт коэффициента корреляции в Mathcad

1. Задаём 2 массива (x и y)

Слайд 12

2. Вычислим средние оценки и стандартное отклонение:

2. Вычислим средние оценки и стандартное отклонение: