Корреляционный анализ

Содержание

Слайд 2

Домашнее задание §19 (стр. 121–126). Вопросы 1, 2 – устно.

Домашнее задание

§19 (стр. 121–126).
Вопросы 1, 2 – устно.

Слайд 3

Регрессионная модель описывает зависимость между количественными характеристиками. строится когда известно, что зависимость между двумя факторами существует.

Регрессионная модель

описывает зависимость между количественными характеристиками.
строится когда известно, что зависимость между

двумя факторами существует.
Слайд 4

Рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является

Рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является

фактор А. На него могут оказывать влияние одновременно многие другие факторы: В, С, D и так далее.
Мы рассмотрим два типа задач:
1) Требуется определить, оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А?
2) Какие из факторов В, С, D и так далее оказывают наибольшее влияние на фактор А?

Новые задачи моделирования

Слайд 5

Пусть фактор А – средняя успеваемость учащихся школы, фактор В –

Пусть
фактор А – средняя успеваемость учащихся школы,
фактор В – финансовые расходы

школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п.
Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.

Рассмотрим школу

Слайд 6

Итак, пусть Хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу

Итак, пусть
Хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу

учеников в школе (руб./чел.), потраченных за определенный период времени (например, за последние 5 лет).
Успеваемость же пусть оценивается средним баллом учеников школы по результатам окончания последнего учебного года.

Хозяйственные расходы → Успеваемость

Слайд 7

(итоги сбора данных по 20 школам)

(итоги сбора данных по 20 школам)

Слайд 8

Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс

Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс

и, на первый взгляд, взаимосвязи между ними не видно.
Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями.
Мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции.

Корреляция

Слайд 9

Раздел математической статистики, который исследует такие зависимости, называется корреляционным анализом. Корреляционный

Раздел математической статистики, который исследует такие зависимости, называется корреляционным анализом.
Корреляционный анализ

изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости.

Корреляционный анализ

Слайд 10

Коэффициент корреляции Коэффициент корреляции обозначается греческой буквой ρ («ро»). Это число,

Коэффициент корреляции

Коэффициент корреляции обозначается греческой буквой ρ («ро»).
Это число, заключенное в

диапазоне от ‒1 до +1 (если это число по модулю близко к 1, то имеет место сильная корреляция, если к 0, то слабая).
Близость ρ к +1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, близость к ‒1 означает обратное.
Значение ρ легко найти с помощью Excel без всяких формул (разумеется, потому, что в Excel они встроены).
Слайд 11

В Excel имеется функция вычисления коэффициента корреляции КОРРЕЛ , входит в

В Excel имеется функция вычисления коэффициента корреляции КОРРЕЛ , входит в

группу статистических функций.
Для вычисления коэффициента корреляции необходимо:
на том же листе Excel, где находится таблица, надо установить курсор на любую свободную ячейку и запустить функцию КОРРЕЛ.
указать два диапазона значений по которым устанавливается зависимость
после их ввода выведется ответ. Эта величина говорит о среднем уровне корреляции

Функция КОРРЕЛ

Слайд 12

Слайд 13

Рассмотрим другой пример, зависимость успеваемости учащихся старших классов от двух факторов:

Рассмотрим другой пример, зависимость успеваемости учащихся старших классов от двух факторов:
обеспеченности

школьной библиотеки учебниками
обеспеченности школы компьютерами.
Нормой обеспеченности учебниками является их полный комплект, то есть такое количество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы книги.
Нормой обеспеченности компьютерами будем считать такое их количество, при котором на каждые четыре старшеклассника в школе приходится один компьютер.

Пример

Слайд 14

(результаты измерения обоих факторов в 11 разных школах)

(результаты измерения обоих факторов в 11 разных школах)

Слайд 15

Слайд 16

Для обеих зависимостей получены коэффициенты линейной корреляции. Как видно из таблицы,

Для обеих зависимостей получены коэффициенты линейной корреляции.
Как видно из таблицы,

корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением и успеваемостью (хотя и тот и другой коэффициенты корреляции не очень большие).
Отсюда можно сделать вывод, что пока еще книга остается более значительным источником знаний, чем компьютер.

Результат

Слайд 17

Выводы С помощью корреляционного анализа можно решить следующие задачи: определить, оказывает

Выводы

С помощью корреляционного анализа можно решить следующие задачи:
определить, оказывает ли один

фактор существенное влияние на другой фактор;
из нескольких факторов выбрать наиболее существенный.
Слайд 18

Задание Задание 3 (стр.126). а) Для данных из таблицы, представленной на

Задание

Задание 3 (стр.126).
а) Для данных из таблицы, представленной на рис. 3.9, постройте

две линейные регрессионные модели.
б) Для этих же данных вычислите коэффициенты корреляции . Сравните с приведенными на рис. 3.9 результатами.