Корреляция. Парная регрессия

Содержание

Слайд 2

Тема 2. Корреляция. Парная регрессия. Функциональные и корреляционные типы связей. Ковариация,

Тема 2. Корреляция. Парная регрессия.

Функциональные и корреляционные типы связей. Ковариация, корреляция.


Анализ линейной статистической связи экономических данных, корреляция; вычисление коэффициентов корреляции, проверка значимости.
Измерение тесноты связи между показателями. Анализ матрицы коэффициентов парной корреляции.
Понятия регрессионного анализа: зависимые и независимые переменные.
Предпосылки применения метода наименьших квадратов (МНК).
Свойства оценок метода наименьших квадратов (МНК).
Линейная модель парной регрессии. Оценка параметров модели с помощью метода наименьших квадратов (МНК).
Показатели качества регрессии модели парной регрессии.
Анализ статистической значимости параметров модели парной регрессии.
Интервальная оценка параметров модели парной регрессии.
Проверка выполнения предпосылок МНК.
Интервалы прогноза по линейному уравнению парной регрессии.(Прогнозирование с применением уравнения регрессии).
Понятие и причины гетероскедастичности. Последствия гетероскедастичности. Обнаружение гетероскедастичности.
Нелинейная регрессия. Нелинейные модели и их линеаризация.
Слайд 3

Функциональные и корреляционные типы связей Рассматривая зависимости между признаками, выделяют две

Функциональные и корреляционные типы связей

Рассматривая зависимости между признаками, выделяют две категории

зависимости:
1) функциональные и 2) корреляционные.
Зависимость величины Y от Х называется функциональной, если каждому значению величины Х соответствует единственное значение величины У.
Корреляционная связь - это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных.
Слайд 4

Слайд 5

Корреляция Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными

Корреляция

Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными

путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи:
отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связи между ними;
обнаружение ранее неизвестных причинных связей.
Слайд 6

При изучении взаимосвязи между двумя факторами их, как правило, обозначают X

При изучении взаимосвязи между двумя факторами их, как правило, обозначают X

и Y
Для измерения силы связи между двумя переменными используется статистическая характеристика, называемая
коэффициентом корреляции
Слайд 7

Оценка значимости коэффициента корреляции при малых объемах выборки выполняется с использованием

Оценка значимости коэффициента корреляции

при малых объемах выборки выполняется с использованием t

- критерия Стьюдента.
Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t Стьюдента с учетом заданного уровня значимости и числа степеней свободы (n-2).
Если tнабл > tкр, то полученное значение коэффициента корре­ляции признается значимым.
При этом фактическое (наблюдаемое) значение этого критерия определяется по формуле:
Слайд 8

Вычисление коэффициентов парной корреляции

Вычисление коэффициентов парной корреляции

Слайд 9

Вычисление коэффициентов парной корреляции

Вычисление коэффициентов парной корреляции

Слайд 10

Влияние аномальных наблюдений на результаты вычислений

Влияние аномальных наблюдений на результаты вычислений

Слайд 11

Слайд 12

Матрица коэффициентов парной корреляции Коэффициенты парной корреляции используются для измерения силы

Матрица коэффициентов парной корреляции

Коэффициенты парной корреляции используются для измерения силы

линейных связей различных пар признаков из их множества. Для множества признаков получают матрицу коэффициентов парной корреляции R.
Слайд 13

Задача 1. Задание по эконометрическому моделированию стоимости квартир в Московской области

Задача 1. Задание по эконометрическому моделированию стоимости квартир в Московской области

Рассчитайте

матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
 Рассчитайте параметры линейной парной регрессии.
 Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера.
Осуществите прогнозирование среднего значения показателя при уровне значимости , если прогнозное значения фактора составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.
Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счёт значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.
Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β - и Δ - коэффициентов.
Слайд 14

Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов

Регрессионный анализ
предназначен для исследования зависимости исследуемой переменной от различных факторов

и отображения их взаимосвязи в форме регрессионной модели.
В регрессионных моделях зависимая переменная Y может быть представлена в виде функции f (Х), где - Х1,Х2,…,Хm независимые (объясняющие) переменные, или факторы.
Связь между переменной Y и m независимыми факторами Х можно охарактеризовать функцией регрессии Y= f (Х1,Х2,…,Хm ), которая показывает, каково будет в среднем значение переменной yi, если переменные Xi примут конкретные значения.
Слайд 15

Примеры задач, решаемых с помощью регрессионных моделей Исследование зависимости заработной платы

Примеры задач, решаемых с помощью регрессионных моделей

Исследование зависимости заработной платы (Y)

от возраста (X1), уровня образования (X2), пола (X3), стажа работы (X4) ( )
Прогноз и планирование выпускаемой продукции по факторам производства (производственная функция Кобба – Дугласа означает, что объем выпуска продукции (Y), является функцией количества капитала ( K ) и количества (L) труда ).
Прогноз объемов потребления продукции или услуг определенного вида (кривая Энгеля
где Y -удельная величина спроса, Х - среднедушевой доход).
Слайд 16

Регрессионные модели с переменной структурой (фиктивные переменные). Построена регрессионная модель зависимости

Регрессионные модели с переменной структурой (фиктивные переменные).

Построена регрессионная модель зависимости заработной

платы работника (Y) от возраста (Х) с использованием фиктивной переменной по фактору пол по 20 работникам одного предприятия
Из полученного уравнения регрессии следует, что при одном и том же возрасте заработная плата у работников мужчин на 17,27$ в месяц выше, чем у женщин.
Из модели, включающей фиктивную переменную можно получить частные уравнения регрессии для работников мужчин (z=1) и женщин (z=0):
Слайд 17

Слайд 18

Администрация страховой компании приняла решение о введении нового вида услуг –


Администрация страховой компании приняла решение о введении нового вида

услуг – страхование на случай пожара. С целью определения тарифов по выборке из 10 случаев пожаров анализируется зависимость стоимости ущерба, нанесенного пожаром от расстояния до ближайшей пожарной станции.

Задача

Слайд 19

Слайд 20

Прогноз по модели Y=10,25+4,69X Прогноз Х По исходным данным полагают, что

Прогноз по модели Y=10,25+4,69X

Прогноз Х
По исходным данным полагают, что расстояние до ближайшей

пожарной станции уменьшится на 5% от своего среднего уровня

Прогноз Y

Слайд 21

Построение доверительного интервала прогноза Стандартная ошибка 1.801

Построение доверительного интервала прогноза

Стандартная ошибка 1.801

Слайд 22

Построение доверительного интервала прогноза Строим доверительный интервал прогноза ущерба с вероятностью

Построение доверительного интервала прогноза
Строим доверительный интервал прогноза ущерба с вероятностью 0,90

(t=1,86). Из полученных результатов видно, что интервал от 20,67 до 27,7 тыс. руб. ожидаемой величины ущерба довольно широкий. Значительная неопределенность прогноза линии регрессии, связана, прежде всего с малым объемом выборки (n=10), а также тем, что по мере удаления прогнозного знаения Х от среднего ширина доверительного интервала увеличивается.

Стандартная ошибка 1.801