Регрессионный анализ. Условные обозначения

Содержание

Слайд 2

Регрессионный анализ Условные обозначения.

Регрессионный анализ Условные обозначения.

Слайд 3

Регрессионный анализ До сих пор Вы изучали способы обработки выборочной совокупности

Регрессионный анализ

До сих пор Вы изучали способы обработки выборочной совокупности такой,

о которой можно было бы сказать: Выборочная совокупность представлена в виде результатов n экспериментов, в каждом из которых реализовывалось значение какой-то случайной величины X. В результате получалась выборка объема n:
Слайд 4

Пусть теперь в эксперименте получается реализация случайного вектора – системы случайных

Пусть теперь в эксперименте получается реализация случайного вектора – системы случайных

величин (X,Y). В результате n экспериментов получается выборочная совокупность объема n:
Пример №1 (общий вид):
Пример №1(частный случай):
X: -1.75 -1.63 -1.86 -1.78 -1.69 -1.70 -1.72
Y: 2.36 2.42 2.63 2.50 2.68 2.51 2.49
В этом примере, очевидно, объем выборки n=7.
Заметим, что в выборке нет одинаковых пар, и, даже по отдельности значения X и Y не повторяются. Можно предположить, что мы имеем дело с системой непрерывных случайных величин.
Слайд 5

Пример №2: Результаты наблюдений сведены в таблицу: В примере 2, очевидно,

Пример №2: Результаты наблюдений сведены в таблицу:
В примере 2, очевидно, объем

выборки n, равный сумме частот по всей таблице: n=89 (проверьте!). Случайный вектор практически достоверно представляет собой систему дискретных случайных величин. В не закрашенной части таблицы приведены частоты mij. Например, значение случайного вектора (X=10,Y=12) – (строка j=4, столбец i=5) повторяется mij=8 раз в проведенных 89 наблюдениях.
Слайд 6

Пример №2(продолжение). Вычислим относительные частоты ωij= mij/n. В результате получим аналогичную

Пример №2(продолжение). Вычислим относительные частоты ωij= mij/n. В результате получим аналогичную

таблицу относительных частот:
Сумма относительных частот по всей таблице равна единице. Не путать с таблицей распределения систем дискретных случайных величин!
Слайд 7

Пример №3: В случае, если мы имеем дело с системой непрерывных

Пример №3: В случае, если мы имеем дело с системой непрерывных

случайных величин, и объем выборки достаточно большой (сотни), то удобно строить интервальную таблицу. На следующем слайде приводится интервальная таблица, полученная обработкой выборки объема n=1423, аналогичной примеру №1. Размахи выборки по случайным величинам X и Y разбиты на ni=10 и nj=12 интервалов соответственно. В таблице указаны середины соответствующих интервалов.
Внимание:
Слайд 8

Слайд 9

Вычисление статистических оценок. Если выборка представлена в форме примера №1, то

Вычисление статистических оценок.

Если выборка представлена в форме примера №1, то можно

воспользоваться формулами: (1)
Исправленным (несмещенным) оценкам припишем индекс _a: (2)
Слайд 10

Вычисление статистических оценок (продолжение). По вышеприведенным формулам (1), (2) следует вычислять

Вычисление статистических оценок (продолжение).

По вышеприведенным формулам (1), (2) следует вычислять статистические

оценки и в случаях иного представления выборки, если, конечно, информация в форме примера №1 не утеряна. Именно в этой форме наиболее удобно проводить вычисления средствами EXCEL. Указанные формулы легко вводить в ячейки EXCEL. Кроме того, функции СРЗНАЧ, ДИСП, КОВАР избавляют даже и от этой необходимости.
Слайд 11

Вычисление статистических оценок (продолжение). Для выборки, представленной в примере№2 удобно использовать

Вычисление статистических оценок (продолжение).

Для выборки, представленной в примере№2 удобно использовать такие

формулы :
(3)
Исправленные оценки пересчитываются по выборочным оценкам по тем же формулам (2), что и ранее.
Слайд 12

Вычисление статистических оценок (продолжение). Внимание! Формулы (3), приведенные для примера №2

Вычисление статистических оценок (продолжение).

Внимание! Формулы (3), приведенные для примера №2 –

это не другие, а ТЕ ЖЕ САМЫЕ формулы (1), что приведены для примера №1 Они выводятся одни из других, и дают идентичные результаты!
Слайд 13

Вычисление статистических оценок (продолжение). Для выборки, представленной в примере№3, если утеряна

Вычисление статистических оценок (продолжение).

Для выборки, представленной в примере№3, если утеряна информация

формы примера №1, следует использовать формулы (3), (2), предварительно создав такую же таблицу, но для относительных частот. При этом роль значений xi, yj играют середины соответствующих интервалов. В этом случае выборочные оценки вычисляются ПРИБЛИЖЕННО!
Формулы (1) и (3) не совпадают в этом случае!
Слайд 14

Регрессионный анализ. Цель и задачи. Целью регрессионного анализа является выявление характера

Регрессионный анализ. Цель и задачи.

Целью регрессионного анализа является выявление характера связи

случайных величин, входящих в систему случайных величин методами математической статистики. Существо причинных связей невозможно выявить статистическими методами, и это не является целью регрессионного анализа.
Слайд 15

Регрессионный анализ. Цель и задачи (продолжение). Как невозможно найти точно математическое

Регрессионный анализ. Цель и задачи (продолжение).

Как невозможно найти точно математическое ожидание

по выборке (а только его оценку в виде выборочного среднего) так и невозможно точно найти линии регрессии по выборочной совокупности в приведенных примерах.
Однако приближенное нахождение линий регрессии является задачей регрессионного анализа.
Зависимость условной средней одной величины от соответствующих значений другой величины называется корреляционной связью, а уравнение связи - уравнением регрессии y на x.
Слайд 16

Вычисление условных средних Если выборка случайного вектора представлена в форме примера

Вычисление условных средних

Если выборка случайного вектора представлена в форме примера №2

или №3, и объем выборки достаточно большой, то возможно вычислить условные средние y(xi) по формуле:
(4)
Слайд 17

Корреляционное поле. Корреляционным полем называется диаграмма, изображающая совокупность значений двух признаков.

Корреляционное поле.

Корреляционным полем называется диаграмма, изображающая совокупность значений двух признаков.
Средствами EXCEL

легко получить корреляционное поле, которое по сути дела является просто точечной диаграммой.
По виду корреляционного поля и, используя другую информацию о системе случайных величин (если она известна), выбирается вид уравнения регрессии (этап спецификации).
Слайд 18

Линейное уравнение парной регрессии. Пример №4: В результате n=30 экспериментов получена

Линейное уравнение парной регрессии.

Пример №4: В результате n=30 экспериментов получена

таблица и построено корреляционное поле.
По виду корреляционного поля делаем вывод о линейной зависимости Y от x, то есть считаем, что систематическая часть y: =α+βx. Проводим вычисления в среде EXCEL:
На следующих слайдах показан лист EXCEL с результатами вычислений и с формулами :
Слайд 19

Слайд 20

Формулы при вводе выглядят так:

Формулы при вводе выглядят так:

Слайд 21

Метод наименьших квадратов дает следующие формулы для вычисления коэффициентов α и

Метод наименьших квадратов дает следующие формулы для вычисления коэффициентов α и

β:
Вычисления по этим формулам приводят к линейной регрессии Y на x:
y=0.4098+1.0401*x
Слайд 22

Если на точечной диаграмме выделить маркеры мышкой, встав на один из

Если на точечной диаграмме выделить маркеры мышкой, встав на один из

них, то можно через контекстное меню добавить линию тренда. При этом следует выбрать линейный тренд и задать «показывать уравнение на диаграмме». Получится такой график: