Парная] корреляция и регрессия. Типы статистических задач

Содержание

Слайд 2

Типы статистических задач

Типы статистических задач

Слайд 3

Выбор статистического теста при сравнении распределений (сравнении центральных тенденций и частот)

Выбор статистического теста при сравнении распределений (сравнении центральных тенденций и частот)

Слайд 4

Задачи оценки взаимосвязи между переменными или прогноза

Задачи оценки взаимосвязи между переменными или прогноза

Слайд 5

Корреляция? Использование коэффициента корреляции позволяет оценить, в какой степени две переменные

Корреляция?

Использование коэффициента корреляции позволяет оценить, в какой степени две переменные изменяются

совместно – увеличивается ли или уменьшается одна переменная при изменении другой.
Коэффициент корреляции – мера силы (тесноты и направления) связи между изменчивостью переменных.
Интерпретация знака коэффициента корреляции – есть вопросы?
Надежность коэффициент корреляции зависит от его величины и n.
Никаких причинных интерпретаций коэффициент корреляции сделать не позволяет!
Коэффициент корреляции может быть использован только для прогноза направления (но не величины!) изменения одной переменной в связи с изменением другой переменной.
Слайд 6

Знаки и теснота коэффициента корреляции

Знаки и теснота коэффициента корреляции

Слайд 7

Техника расчета r Пирсона «Пример_тм_токсичность_преобразования.xls» (Cu_хлорид * Cd_хлорид вместе и по

Техника расчета r Пирсона

«Пример_тм_токсичность_преобразования.xls» (Cu_хлорид * Cd_хлорид вместе и по зонам

)
Пары переменных или матрицы;
Просмотр результатов в разном расширении;
Иллюстрации;
Категоризированные зависимости
Слайд 8

Нарушение «нормальности»: управление выбросами: перед удалением

Нарушение «нормальности»: управление выбросами: перед удалением

Слайд 9

Нарушение «нормальности»: управление выбросами: после удаления

Нарушение «нормальности»: управление выбросами: после удаления

Слайд 10

Управление выбросами: инструмент «кисть» Пример_тм_токсичность_преобразования.xls; Cu_хлорид * Cd_хлорид вместе

Управление выбросами: инструмент «кисть»

Пример_тм_токсичность_преобразования.xls;
Cu_хлорид * Cd_хлорид вместе

Слайд 11

Управление выбросами: общие правила отсутствуют

Управление выбросами: общие правила отсутствуют

Слайд 12

Осторожно: корреляция в неоднородных группах ! Пример_тм_токсичность_преобразования.xls; Cu_хлорид * Cd_хлорид вместе и по зонам

Осторожно: корреляция в неоднородных группах !

Пример_тм_токсичность_преобразования.xls;
Cu_хлорид * Cd_хлорид вместе и

по зонам
Слайд 13

Условие продуктивного использования коэффициентов корреляции: достаточная дисперсия данных

Условие продуктивного использования коэффициентов корреляции: достаточная дисперсия данных

Слайд 14

Правильный/неправильный расчет и интерпретация r (во всех случаях r=0,816 и P

Правильный/неправильный расчет и интерпретация r (во всех случаях r=0,816 и P одинаковая)

Корректный

расчет и использование

Так делать можно, но зависимость явно не полностью описывается с использованием r.

Явное нарушение условий использования r: «выбросы» и отклонение от нормального распределения.

Слайд 15

Слайд 16

Оперирование «пропущенными значениями» при расчете корреляционных матриц

Оперирование «пропущенными значениями» при расчете корреляционных матриц

Слайд 17

Замена пропущенных значений средними: возможность минимизировать ущерб от пропущенных данных Пример_тм_токсичность_преобразования.xls;

Замена пропущенных значений средними: возможность минимизировать ущерб от пропущенных данных

Пример_тм_токсичность_преобразования.xls;
Операции

с переменными:
«CEC»
«Hidr»
«ac-ex»
«Al»
С учетом «зон»!
Слайд 18

Слайд 19

Непараметрическая корреляция

Непараметрическая корреляция

Слайд 20

Коэффициент корреляции Спирмена аналог коэффициента Пирсона; подходит для расчета корреляционных матриц; Размер выборки: >10.

Коэффициент корреляции Спирмена

аналог коэффициента Пирсона;
подходит для расчета корреляционных матриц;
Размер выборки: >10.


Слайд 21

Линейная (парная) регрессия Задача: предсказать значение одной переменной на основании другой

Линейная (парная) регрессия

Задача: предсказать значение одной переменной на основании другой

на основе аппроксимации – линии.
Переменные: зависимая (Y) и независимая (X).
Предположения:
линейная зависимость между переменными;
независимость измерений отдельных X и Y от других измерений X и Y;
двумерное нормальное распределение и нормальное распределение «остатков», т.е. разностей между наблюдаемыми и предсказываемыми величинами Y.
Интерпретация (при правильной постановке вопроса и правильном расчете): причинная и объясняющая.
Формальное выражение: Y = aX + b.
Слайд 22

Y = aX + b Изменчивость данных возле линии регрессии характеризует

Y = aX + b

Изменчивость данных возле линии регрессии характеризует параметр

R2 – простой квадрат коэффициента корреляции Пирсона (в случае линейной регрессии).
НО!!!
Показатель R2 приемлем и для нелинейных и для множественных зависимостей. Интерпретируется он как…..?
Слайд 23

Слайд 24

Пункт меню «Графы»: ШИРОЧАЙШИЕ возможность построения диаграмм как без расчета статистик, так и с расчетом таковых

Пункт меню «Графы»: ШИРОЧАЙШИЕ возможность построения диаграмм как без расчета статистик,

так и с расчетом таковых
Слайд 25

Корреляционные и регрессионные зависимости могут быть проиллюстрированы в разных пунктах:

Корреляционные и регрессионные зависимости могут быть проиллюстрированы в разных пунктах:

Слайд 26