Математические методы в психологии

Содержание

Слайд 2

Оглавление (для перехода к соответствующему разделу нажмите кнопку) Введение Понятие генеральной

Оглавление (для перехода к соответствующему разделу нажмите кнопку)

Введение
Понятие генеральной совокупности и выборки
Измерения

и шкалы
Формы учета результатов измерений
Числовые характеристики распределений, нормальный закон распределения и его свойства
Общие принципы проверки статистических гипотез
Статистические критерии (непараметрические)
Статистические критерии. Примеры обработки данных в SPSS
Статистические критерии. Фильм по обработке данных в SPSS
Сравнение средних (t-критерии Стьюдента)
Одно выборочный t Стьюдента. Фильм 1 по обработке в SPSS
t-критерии -критерии Стьюдента. Фильм 2
Однофакторный дисперсионный анализ (ANOVA)
Однофакторный дисперсионный анализ (ANOVA). Фильм
Корреляционный анализ
Корреляционный анализ Фильм
Слайд 3

Исследование в любой области, в том числе и в педагогике, психологии,

Исследование в любой области, в том числе и в педагогике, психологии,

социологии, предполагает получение результатов - обычно в виде чисел (Как писал А. де Сент-Экзюпери «взрослые люди любят цифры»). Проще говоря необходимо научиться отвечать на простой вопрос «да» или «нет» - только что «да» или «нет». Исследователю необходимо умение собрать, организовать данные, обработать и проинтерпретировать их, что невозможно без знания основ статистики, применения математических методов и соответствующих современных программных средств. Естественно, что наличие современных пакетов прикладных программ, применение которых сейчас становится нормой для исследователя значительно упрощает и ускоряет процесс обработки данных .
Слайд 4

Но любая программа обработки данных переводит один набор чисел в другой

Но любая программа обработки данных переводит один набор чисел в другой

набор чисел. При этом предлагается богатый набор способов такого преобразования, замечательным образом расширяющий возможности анализа данных. И для использования этих возможностей психолог должен уметь:
а) организовать исследование так, чтобы его результаты были доступны обработке в соответствии с целями и задачами исследования;
б) правильно выбрать метод обработки с учетом собранных эмпирических данных;
в) содержательно интерпретировать результаты обработки.
Слайд 5

Эти умения не заменят ни компьютерная программа, ни математик и программист,

Эти умения не заменят ни компьютерная программа, ни математик и программист,

придумавшие и написавшие данную программу.
Таким образом, применение математики как общенаучного метода, наряду с экспериментом, неизбежно приобретает в психологии свои особенности, связанные со спецификой предмета.
При этом следует исходить из того, что в широком смысле слова рассматриваются не отдельные «предметы», а единое информационное пространство с учетом всех связей и зависимостей, которые на первый взгляд не видны, или просто кажутся не весьма не значительными.
Поэтому следует руководствоваться следующими принципами которые приведены ниже.
Слайд 6

Единое информационное пространство ЧЕЛОВЕКОВЕДЕНИЕ ПЕДАГОГИКА ПСИХОЛОГИЯ СОЦИОЛОГИЯ Педагогическая Психология Социальная психология Социальная педагогика

Единое
информационное
пространство

ЧЕЛОВЕКОВЕДЕНИЕ

ПЕДАГОГИКА

ПСИХОЛОГИЯ

СОЦИОЛОГИЯ

Педагогическая
Психология

Социальная
психология

Социальная
педагогика

Слайд 7

Основные вопросы, на которые нужно уметь отвечать специалисту (любому!) ЭТО И ЕСТЬ ОСНОВЫ СИСТЕМНО-СТРУКТУРНОГО АНАЛИЗА

Основные вопросы, на которые
нужно уметь отвечать специалисту (любому!)

ЭТО И ЕСТЬ
ОСНОВЫ

СИСТЕМНО-СТРУКТУРНОГО
АНАЛИЗА
Слайд 8

Основные задачи, которые стоят перед специалистом ОСНОВНОЕ: ФОРМИРОВАНИЕ ПРОФЕССИОНАЛЬНЫХ КОМПЕТЕНЦИЙ

Основные задачи, которые стоят перед специалистом

ОСНОВНОЕ:
ФОРМИРОВАНИЕ ПРОФЕССИОНАЛЬНЫХ
КОМПЕТЕНЦИЙ

Слайд 9

Соотношение обыденного и научного познания

Соотношение обыденного и научного познания

Слайд 10

Генеральная совокупность и выборка В дальнейшем мы будем исходить из следующих

Генеральная совокупность и выборка

В дальнейшем мы будем исходить из следующих положений:
Генеральная

совокупность — это все множество объектов, в отношении которого формулируется исследовательская гипотеза. Например, студенты одного вуза, жители одного города и т.д.
Выборка — это ограниченная по численности группа объектов (в психологии — испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием
в отличии от сплошного.
Практически все психолого-педагогические исследования являются выборочными, а их выводы распространяются на генеральные совокупности при соблюдении следующих обязательных условий:
выборка должна быть репрезентативной и статистически достоверной (валидной).
Слайд 11

Репрезентативность выборки — иными словами, ее представительность - это способность выборки

Репрезентативность выборки — иными словами, ее представительность - это способность выборки

представлять изучаемые явления достаточно полно с точки зрения их изменчивости в генеральной совокупности.
Способы получения репрезентативной выборки
Основной прием - это простой случайный отбор или, в настоящее время используется генератор случайных чисел с использованием ПК.
Второй способ обеспечения репрезентативности — это стратифицированный случайный отбор с разбиением выборки на страты по определенному правилу.
Валидность (или достаточность) выборки.
Валидность может рассматриваться как мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам, а объем достаточен для распространения полученных результатов на всю генеральную совокупность.
Слайд 12

Статистическая достоверность, или статистическая значимость, результатов исследования определяется при помощи методов

Статистическая достоверность, или статистическая значимость, результатов исследования определяется при помощи методов

статистического вывода которые предъявляют определенные требования к численности, или иными словами к объему выборки.
Зависимые и независимые выборки. Обычна ситуация исследования, когда интересующее исследователя свойство изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях - в зависимости от процедуры их организации.
Независимые выборки (не связанные) характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки (например, разные классы из разных школ) .
Зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки, либо тот же испытуемый, но в сравнении с различными испытаниями.
Слайд 13

ИЗМЕРЕНИЯ И ШКАЛЫ Измерение в терминах производимых исследователем операций - это

ИЗМЕРЕНИЯ И ШКАЛЫ

Измерение в терминах производимых исследователем операций - это приписывание

объекту числа по определенному правилу. Это правило устанавливает соответствие между измеряемым свойством объекта и результатом измерения - признаком.
Шкалы разделяют на метрические (если есть или может быть установлена единица измерения) и не метрические (если единицы измерения не могут быть установлены). Принято использовать четыре типа шкал.
1. Номинативная шкала (неметрическая), или шкала наименований. В ее основе лежит процедура, обычно не ассоциируемая с измерением (присваиваемый символ не подлежит статистической обработке).
2. Ранговая, или порядковая шкала (неметрическая), как результат ранжирования (упорядочивания) признаков по определенному правилу.
Слайд 14

3. В шкале интервалов, или интервальной шкале, каждое из возможных значений

3. В шкале интервалов, или интервальной шкале, каждое из возможных значений

измеренных величин отстоит от ближайшего на равном расстоянии. Главное понятие этой шкалы — интервал, который можно определить как долю или часть измеряемого свойства между двумя соседними позициями на шкале.
Шкалу отношений называют также шкалой равных отношений. Особенностью этой шкалы является наличие твердо фиксированного нуля, который означает полное отсутствие какого-либо свойства или признака Шакала отношений является наиболее информативной шкалой, допускающей любые математические операции и использование разнообразных статистических методов.
Слайд 15

ФОРМЫ УЧЕТА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ Исходная информация может быть представлена в виде:

ФОРМЫ УЧЕТА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ

Исходная информация может быть представлена в виде:
Таблиц;
Числовых последовательностей;
Статистических

рядов;
Графиков;
Диаграмм.
Слайд 16

Пример обычной таблицы Сбор информации о «праворуких» и «леворуких» учениках одной школы

Пример обычной таблицы Сбор информации о «праворуких» и «леворуких» учениках одной школы

Слайд 17

Числовая последовательность: 2; 4; 6; 6; 8; 8; 8; 9; 9;

Числовая последовательность:
2; 4; 6; 6; 8; 8; 8; 9; 9; 10
Статистический

ряд
X i – случайная величина
f i – частота
Pi – вероятность.
где
N -объем выборки
Слайд 18

Пример формирования имени признака, метки и её значений с помощью SPSS

Пример формирования имени признака, метки и её значений с помощью SPSS

(Statistical Package for the Social Science– Статистический пакет для социальных наук)
Слайд 19

Пример представления данных в виде таблицы в SPSS (столбец – признак, строка – респондент)

Пример представления данных в виде таблицы в SPSS
(столбец – признак,

строка – респондент)
Слайд 20

Пример таблицы сопряженности (перекрестной таблицы) Связь социального положения и психического состояния

Пример таблицы сопряженности (перекрестной таблицы) Связь социального положения и психического состояния для

студентов обучающихся в одном из университетов Германии
Слайд 21

Столбчатая диаграмма, полученная из таблицы сопряженности (связь психического состояния и социального положения)

Столбчатая диаграмма, полученная из таблицы сопряженности (связь психического состояния и социального

положения)
Слайд 22

Данные полученные после обработки таблиц сопряженности с разбиением на страты (по полу: женский и мужской)

Данные полученные после обработки таблиц сопряженности с разбиением на страты (по полу:

женский и мужской)
Слайд 23

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Числовой характеристикой выборки как правило не

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Числовой характеристикой выборки как правило не

требующей вычислений является так называемая мода, такое числовое значение которое встречается в выборке наиболее часто.
Медиана — это значение которое делит упорядоченное множество данных пополам.
Среднее арифметическое ряда из и числовых значений Xi…Xn обозначается Mx и подсчитывается как:
где N – объем выборки, Xi – значение .
Слайд 24

Квантиль - это точка на числовой прямой, которая делит совокупность исходных

Квантиль - это точка на числовой прямой, которая делит совокупность исходных наблюдений на две

части с известными пропорциями в каждой из частей. Так. Например, один из квантилей - это медиана, значение признака, которое делит всю совокупность измерений на две группы с равной численностью.
Процентили - это 99 точек — значений признака (Р1 ..., Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности, так 50 процентиль соответствует медиане.
Меры изменчивости применяются в психологии для численного выражения величины межиндивидуальной вариации признака.
Очевидной мерой изменчивости является размах, это разность максимального и минимального значений
Слайд 25

Дисперсия — мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений

Дисперсия — мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений

измеренных значений от их арифметического среднего.
Дисперсия и средеквадратичное отклонение

Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Величина дисперсии получается при усреднении всех квадратов отклонений:

Слайд 26

Нормальное распределение играет большую роль в математической статистике, поскольку многие статистические

Нормальное распределение играет большую роль в математической статистике, поскольку многие статистические

методы предполагают, что, анализируемые с их помощью экспериментальные данные распределены нормально.
Если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения. Это и есть закон нормального распределения.
График нормального распределения имеет вид колоколообразной кривой, а формула для вычисления представлена ниже:
Слайд 27

Стандартное нормальное распределение (μ=0,σ=1)

Стандартное нормальное распределение (μ=0,σ=1)

Слайд 28

Нормальный закон распределения. Представлены 4 кривые с различными параметрами (μ,σ) Заштрихованные

Нормальный закон распределения. Представлены 4 кривые с различными параметрами (μ,σ)

Заштрихованные области

показывают «перекрытие» кривых (1 и 2) и (3 и 4) (с одинаковыми значениями σ(соответственно 1 и 2) и разницей средних - μ в 2 единицы
Слайд 29

Пример распределения близкого к нормальному

Пример распределения близкого к нормальному

Слайд 30

Для отражения близости формы распределения к нормальному виду существует две основные

Для отражения близости формы распределения к нормальному виду существует две основные

характеристики: асимметрия и эксцесс.
Эксцесс (kurtosis) является мерой сглаженности (остро- или плосковершинности) распределения. Если значение эксцесса близко к 0, это означает, что форма распределения близка к нормальному виду. Положительный эксцесс указывает на плосковершинное распределение, у которого максимум вероятности выражен не столь ярко, как у нормального. Значения эксцесса, превышающие 5,0, говорят о том, что по краям распределения находится больше значений, чем вокруг среднего. Отрицательный эксцесс, напротив, характеризует островершинное распределение, график которого более вытянут по вертикальной оси, чем график нормального распределения.
Считается, что распределение с эксцессом в диапазоне от -1 до +1 примерно соответствует нормальному виду. В большинстве случаев вполне допустимо считать нормальным распределение с эксцессом, по модулю не превосходящим 2;
Слайд 31

Асимметрия (skewness) показывает, в какую сторону относительно среднего сдвинуто большинство значений

Асимметрия (skewness) показывает, в какую сторону относительно среднего сдвинуто большинство значений

распределения. Нулевое значение асимметрии означает симметричность распределения относительно среднего значения. Положительная асимметрия указывает на сдвиг распределения в сторону меньших значений, а отрицательная — в сторону больших значений. В большинстве случаев за нормальное принимается распределение с асимметрией, лежащей в пределах от -1 до +1.
В исследованиях, не требующих высокой точности результатов, нормальным считают распределение с асимметрией, по модулю не превосходящей 2.
Слайд 32

Асимметрия – это показатель симметричности / скошенности кривой распределения, а эксцесс

Асимметрия – это показатель симметричности / скошенности кривой распределения, а эксцесс

определяет ее островершинность.
При левостронней асимметрии ее показатель является положительным и в распределении преобладают более низкие значения признака. При правостронней – показатель положительный и преобладают более высокие значения. У всех симметричных распеделений (в том числе и у нормального распределения) величина асимметрии равна нулю. Формула показателя асимметрии является следующей:
Слайд 33

Если в распределении преобладают значения близкие к среднему арифметическому, то формируется

Если в распределении преобладают значения близкие к среднему арифметическому, то формируется

островершинное распределение. В этом случае показатель эксцесса стремится к положительной величине. У нормального распределения эксцесс равен нулю. Если у распределения 2 вершины (бимодальное распределение), то тогда эксцесс стремится к отрицательной величине. Показатель эксцесса определяется по формуле:
Слайд 34

Распределение оценивается как предположительно близкое к нормальному, если установлено, что от

Распределение оценивается как предположительно близкое к нормальному, если установлено, что от

50 до 80 % всех значений располагаются в пределах одного стандартного отклонения от среднего арифметического, и коэффициент эксцесса по абсолютной величине не превышает значения равного двум.
Распределение считается достоверно нормальным если абсолютная величина показателей асимметрии и эксцесса меньше их ошибок репрезентативности в 3 и более раз.
Слайд 35

Пример левосторонней и правосторонней асимметрии

Пример левосторонней и правосторонней асимметрии

Слайд 36

Островершинное и плосковершинное распределение в сравнении с нормальным распределением

Островершинное и плосковершинное распределение в сравнении с нормальным распределением

Слайд 37

ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ Под статистической гипотезой обычно понимают формальное

ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

Под статистической гипотезой обычно понимают

формальное предположение о том, что сходство (или различие) некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно.
При проверке статистических гипотез используются два понятия так называемая
нулевая - Hо (гипотеза о совпадении) и альтернативная гипотеза H1 (гипотеза о различии)
Слайд 38

Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы. Или уровень значимости

Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы. Или уровень значимости

это вероятность ошибки первого рода при принятии решения
Слайд 39

Традиционная интерпретация уровней значимости при α=0.05

Традиционная интерпретация уровней значимости при α=0.05

Слайд 40

Традиционная интерпретация уровней значимости при α=0.05 (А.Д. Наследов)

Традиционная интерпретация уровней значимости при α=0.05 (А.Д. Наследов)

Слайд 41

Из приведенного ниже слайда следует, что точка на оси значимости отражает

Из приведенного ниже слайда следует, что точка на оси значимости отражает

положение полученного результата относительно двух точек:
Gтеор 0,05 и Gтеор 0,01.
Использование таблиц, рассчитанных для конкретных критериев позволяет ответить на вопрос об уровне значимости анализируемого результата.
Слайд 42

Общие принципы анализа результатов исследования При использовании компьютерных методов обработки получается

Общие принципы анализа результатов исследования
При использовании компьютерных методов обработки получается асимптотическое

значение, которое и сравнивается с указанными выше значениями (0,05 и 0,01).
Слайд 43

Схема - классификации статистических гипотез Статистические гипотезы Направленные нулевая Ненаправленные альтерна-

Схема - классификации статистических гипотез

Статистические гипотезы

Направленные

нулевая

Ненаправленные

альтерна-
тивная

нулевая

альтерна-
тивная

Н0: Х1 не превышает Х2
Н1: Х1

превышает Х2

Н0: Х1 не отличается от Х2
Н1: Х1 отличается Х2
,

Слайд 44

Классификация задач, решаемых с использованием математических методов Задачи, требующие установления сходства

Классификация задач, решаемых с использованием математических методов

Задачи, требующие установления сходства или

различия.
Задачи, требующие группировки и классификации данных.
Задачи, ставящие целью анализ источников вариативности получаемых психологических признаков.
Задачи, предполагающие возможность прогноза на основе имеющихся данных
Слайд 45

Классификация психологических задач по методам обработки (по Е. Сидоренко)

Классификация психологических задач
по методам обработки (по Е. Сидоренко)

Слайд 46

Дополнительные возможности

Дополнительные возможности

Слайд 47

СТАТИСТИЧЕСКИЕ КРИТЕРИИ

СТАТИСТИЧЕСКИЕ КРИТЕРИИ

Слайд 48

Параметрические критерии Критерии, включающие в формулу расчета параметры распределения, то есть

Параметрические критерии
Критерии, включающие в формулу расчета параметры распределения, то есть средние

и дисперсии (t-критерий Стьюдента, критерий Фишера и др.).
Непараметрические критерии
Критерии, не включающие в формулу расчета параметры распределения и основанные на оперировании частотами или рангами (критерий знаков – Q-критерий, критерий Фридмана, критерий Вилкоксона и др.)
И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позволяющую оценить возможности и ограничения тех и других.
Возможности и ограничения параметрических и непараметрических критериев
Слайд 49

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Позволяют прямо оценить различия в средних, полученных в двух

ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
Позволяют прямо оценить различия в средних, полученных в двух выборках

(t - критерий Стьюдента).
Позволяют прямо оценить различия в дисперсиях (критерий Фишера).
Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии предположения о нормальном распределении признака.
Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (факторный анализ).
При этом, экспериментальные данные должны отвечать двум, а иногда трем, условиям:
а) значения признака измерены по интервальной или абсолютной шкале;
б) распределение признака является нормальным.
Математические расчеты без использования пакетов прикладных программ (напр. SPSS) довольно сложны.
Если условия, перечисленные выше выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические.
Слайд 50

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ 1. Позволяют оценить лишь средние тенденции, например, ответить на

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
1. Позволяют оценить лишь средние тенденции, например, ответить на вопрос,

чаще ли в выборке А встречаются более высокие, а в выборке Б - более низкие значения признака (критерии Q, U, φ* и др.).
2.Позволяют оценить лишь различия в диапазонах вариативности признака (критерий φ*).
3.Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S).
Слайд 51

4. Экспериментальные данные могут не отвечать ни одному из этих условий:

4. Экспериментальные данные могут не отвечать ни одному из этих условий:
а) значения

признака могут быть представлены в любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке;
в) требование равенства дисперсий отсутствует.
5. Математические расчеты по большей части просты и занимают мало времени (за исключением критериев χ2 и λ).
6. Если условия, перечисленные в п.4, не выполняются, непараметрические критерии оказываются более мощными, чем параметрические, так как они менее чувствительны к "засорениям".
Слайд 52

Общие принципы анализа результатов исследования При использовании компьютерных методов обработки получается

Общие принципы анализа результатов исследования
При использовании компьютерных методов обработки получается асимптотическое

значение, которое и сравнивается с указанными выше значениями (0,05 и 0,01).
Слайд 53

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Связанные (зависимые выборки) К=2 Не связанные (независимые выборки) К>2

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

Связанные (зависимые выборки)

К=2

Не связанные (независимые выборки)

К>2

К=2

К>2

G-знаков
Уилкоксона
МакНемара

Фридмана

Манна-
Уитни

Краскела-
Уоллиса

Слайд 54

G - Критерий знаков Критерий знаков используется при проверке нулевой гипотезы

G - Критерий знаков
Критерий знаков используется при проверке нулевой гипотезы о

равенстве двух непрерывно распределенных случайных величин. Критерий применяется к паре связанных выборок. Он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность чем более специализированные критерии.
Т- критерий или критерий Уилкоксона
Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом
Слайд 55

Критерий Мак-Немара - является аналогом непараметрического критерия Уилкоксона, применяется для анализа

Критерий Мак-Немара - является аналогом непараметрического критерия Уилкоксона, применяется для анализа

связанных измерений в случае изменения реакции с помощью дихотомической переменной. По результатам такого исследования строится результирующая таблица 2x2 в виде:
Слайд 56

Критерий Фридмана - это непараметрический аналог дисперсионного анализа повторных измерений, применяется

Критерий Фридмана - это непараметрический аналог дисперсионного анализа повторных измерений, применяется

для анализа повторных измерений, связанных с одним и тем же индивидуумом. Логика критерия очень проста.
Например, каждый испытуемый ровно один раз подвергается каждому методу воздействия (или наблюдается в фиксированные моменты времени). Результаты наблюдения у каждого испытуемого упорядочиваются.
Причем отдельно упорядочиваются значения у каждого испытуемого независимо от всех остальных. Таким образом получается столько упорядоченных рядов, сколько испытуемых участвует в исследовании. Далее, для каждого метода воздействия вычисляется сумма рангов. Если разброс сумм велик - различия статистически значимы.
Слайд 57

U-критерий Манна — Уитни Непараметрический критерий, используемый для оценки различий между

U-критерий Манна — Уитни Непараметрический критерий, используемый для оценки различий между двумя

независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны
Слайд 58

Н - критерий Крускала-Уоллиса. Критерий предназначен для оценки различий одновременно между

Н - критерий Крускала-Уоллиса. Критерий предназначен для оценки различий одновременно между тремя,

четырьмя и т.д. выборками по уровню какого-либо признака. Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок. Критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок
Слайд 59

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ обращение к критериям через SPSS

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ обращение к критериям через SPSS

Слайд 60

SPSS Критерий Вилкоксона

SPSS Критерий Вилкоксона

Слайд 61

Критерий Вилкоксона (обработка)

Критерий Вилкоксона (обработка)

Слайд 62

Критерий Фридмана (исходный набор данных и обращение к критерию)

Критерий Фридмана (исходный набор данных и обращение к критерию)

Слайд 63

Результат обработки Нулевая гипотеза подтверждена

Результат обработки
Нулевая гипотеза подтверждена

Слайд 64

Критерий МакНемара

Критерий МакНемара

Слайд 65

Различия на уровне значимости 0,05

Различия на уровне значимости 0,05

Слайд 66

Критерий Манна Уитни Сравнение результатов контрольной работы двух классов. Данные ранжированы

Критерий Манна Уитни

Сравнение результатов контрольной работы двух классов. Данные ранжированы

Слайд 67

Критерий Манна Уитни, различие на уровне 0,05. Ненулевая гипотеза не подтвердилась

Критерий Манна Уитни, различие на уровне 0,05. Ненулевая гипотеза не подтвердилась

Слайд 68

Критерий Краскала-Уоллеса. Время решения задач разными группами

Критерий Краскала-Уоллеса. Время решения задач разными группами

Слайд 69

Обработка критерия

Обработка критерия

Слайд 70

Слайд 71

Т-критерий Стьюдента Критерий t Стьюдента направлен на оценку различий величин средних

Т-критерий Стьюдента

Критерий t Стьюдента направлен на оценку различий величин средних и

двух выборок X и Y, которые распределены по нормальному закону. Одним из главных достоинств критерия является широта его применения. Он может быть использован для сопоставления средних у связных и несвязных выборок, причем выборки могут быть не равны по величине.
Случай несвязных выборок
В общем случае формула для расчета по t - критерию Стьюдента
такова:
где
Рассмотрим сначала равночисленные выборки. В этом случае n1 = n2 = n, тогда выражение будет вычисляться следующим образом:
Слайд 72

В случае неравночисленных выборок , выражение будет вычисляться следующим образом: В

В случае неравночисленных выборок , выражение будет вычисляться следующим образом:
В

обоих случаях подсчет числа степеней свободы осуществляется по формуле:
где n1 и n2 соответственно величины первой и второй выборки.
Понятно, что при численном равенстве выборок k = 2
n - 2.
Слайд 73

Различные варианты обработки данных с применением t -критерия позволяют сделать вывод

Различные варианты обработки данных с применением
t -критерия позволяют сделать вывод

о различии двух средних значений.
Например, в случае применения t-критерия для независимых выборок проверяется достоверность различия двух выборок по количественной переменной, измеренной у представителей этих двух выборок. Для этих выборок вычисляются средние значения количественной переменной, затем по t –критерию определяется статистическая значимость различия средних. Применение t -критерия, по-видимому, самый распространенный метод статистического вывода, так как позволяет ответить на простой вопрос: «Насколько существенны различия между двумя выборками по данной количественной переменной?» Основное требование к данным для применения этого критерия — представление переменных, по которым сравниваются выборки, в метрических единицах измерения.
Слайд 74

T-критерий для независимых выборок предназначен для сравнения средних значений двух выборок.

T-критерий для независимых выборок предназначен для сравнения средних значений
двух выборок. Для

сравниваемых выборок должны быть определены значения
одной и той же переменной. С помощью t-критерия для независимых выборок можно сравнить успеваемость студентов и студенток, степень удовлетворенности жизнью холостяков и женатых, средний рост футболистов двух команд и пр. Обязательным условием для проведения этого t-критерия является независимость выборок.
Непараметрическим аналогом t-критерия является критерий Манна-Уитни
Слайд 75

T-критерий для парных, или зависимых, выборок позволяет сравнить средние значения двух

T-критерий для парных, или зависимых, выборок позволяет сравнить средние значения двух

измерений одного признака для одной и той же выборки, например результаты первого и последнего экзаменов группы студентов или значения показателя до и после воздействия на группу. Обязательным условием применения T-критерия для зависимых выборок является наличие повторного измерения для одной выборки.
Непараметрическим аналогом t-критерия является критерий Уилкоксона
Слайд 76

Одновыборочный t-критерий позволяет сравнить среднее значение этой выборки с некоторой эталонной

Одновыборочный t-критерий позволяет сравнить среднее значение этой выборки с некоторой эталонной

величиной. Например, отличается ли среднее значение некоторого теста для данной выборки от нормативной величины, отличается ли время, показанное бегунами во время соревнования, от 17 минут и т. д.
Слайд 77

t-критерий Стьюдента обращение к критерию из SPSS

t-критерий Стьюдента обращение к критерию из SPSS

Слайд 78

T-критерий для независимых выборок Обработка (ex01.sav) см. А.Д. Наследов

T-критерий для независимых выборок Обработка (ex01.sav) см. А.Д. Наследов

Слайд 79

Слайд 80

T-критерий для парных выборок Обработка (ex01.sav) см. А.Д. Наследов Сравнение успеваемости по двум срезам

T-критерий для парных выборок Обработка (ex01.sav) см. А.Д. Наследов

Сравнение успеваемости по

двум срезам
Слайд 81

Слайд 82

Значимое различие оценок 1-го и 2-го измерения

Значимое различие оценок 1-го и 2-го измерения

Слайд 83

Одновыборочный T-критерий. Сравнение средних с эталоном (ex01.sav) см. А.Д. Наследов

Одновыборочный T-критерий. Сравнение средних с эталоном (ex01.sav) см. А.Д. Наследов

Слайд 84

Слайд 85

Слайд 86

T - критерий для независимых и связанных выборок

T - критерий для независимых и связанных выборок

Слайд 87

Дисперсионный анализ Дисперсионный анализ (Analysis Of Variances, ANOVA — общепринятое обозначение

Дисперсионный анализ

Дисперсионный анализ (Analysis Of Variances, ANOVA — общепринятое обозначение

метода) — это процедура сравнения средних значений выборок, на основании которой можно сделать вывод о соотношении средних значений генеральных совокупностей.
Анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов.
Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:
- Вариативность, обусловленную действием каждой из исследуемых независимых переменных.
- Вариативность, обусловленную взаимодействием исследуемых независимых переменных.
- Вариативность случайную, обусловленную всеми неучтенными обстоятельствами.
Слайд 88

Ближайшим и более простым аналогом ANOVA является t-критерий. В отличие от

Ближайшим и более простым аналогом ANOVA является t-критерий.
В отличие от

t-критерия дисперсионный анализ предназначен для сравнения не двух, а нескольких выборок. Слово «дисперсионный» в названии указывает на то, что в процессе анализа сопоставляются компоненты дисперсии изучаемой переменной. Общая изменчивость переменной раскладывается на две составляющие: межгрупповую (факторную), обусловленную различием групп (средних значений), и внутригрупповую (ошибки), обусловленную случайными (неучтенными) причинами. Чем больше частное от деления межгрупповой изменчивости на внутригрупповую (F-отношение), тем больше различаются средние значения сравниваемых выборок и тем выше статистическая значимость этого различия.
Слайд 89

Вариативность, обусловленная действием исследуемых переменных и их взаимодействием соотносится со случайной

Вариативность, обусловленная действием исследуемых переменных и их взаимодействием соотносится со случайной вариативностью.

Показателем этого соотношения является 
F – критерий Фишера, который используется для сравнения дисперсий двух вариационных рядов.
Он вычисляется по формуле:
где  S1 - большая дисперсия,  S2- меньшая дисперсия.
Если вычисленное значение критерия F больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются различными.
Число степеней свободы числителя и знаменателя определяется по формуле: ni-1 (i=1;2),
Слайд 90

Например, если мы выдвигаем гипотезу о зависимости успешности работы должностного лица

Например, если мы выдвигаем гипотезу о зависимости успешности работы должностного лица

от фактора Н (социальной смелости по Кэттелу), то не исключено обратное: социальная смелость респондента как раз и может возникнуть (усилиться) вследствие успешности его работы – это с одной стороны. С другой: следует отдать себе отчет в том, как именно измерялась «успешность»? Если за ее основу взяты были не объективные характеристики (модные нынче «объемы продаж» и проч.), а экспертные оценки сослуживцев, то имеется вероятность того, что «успешность» может быть подменена поведенческими или личностными характеристиками (волевыми, коммуникативными, внешними проявлениями агрессивности и .т.д.)
Слайд 91

Исходные данные для дисперсионного анализа

Исходные данные для дисперсионного анализа

Слайд 92

Запуск процедуры вычислений

Запуск процедуры вычислений

Слайд 93

Слайд 94

Слайд 95

Слайд 96

Слайд 97

Зависимость счет в уме/хобби

Зависимость счет в уме/хобби

Слайд 98

Слайд 99

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Корреляция - это статистическая взаимосвязь двух или нескольких случайных

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Корреляция - это статистическая  взаимосвязь двух или нескольких случайных величин (либо величин,

которые можно с некоторой допустимой степенью точности считать таковыми).
При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.
Математической мерой корреляции двух случайных величин служит корреляционное отношение, либо коэффициент корреляции. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.
Слайд 100

Использование коэффициентов корреляции в зависимости от типа шкалы измерения

Использование коэффициентов корреляции в зависимости от типа шкалы измерения

Слайд 101

Корреляция Пирсона, называемся так же линейной корреляцией. Установить прямую связь между

 Корреляция Пирсона, называемся так же линейной корреляцией. Установить прямую связь между

переменными и их абсолютными значениями стало возможно благодаря линейному корреляционному анализу. Коэффициент Пирсона позволяет устанавливать тесноту связей между признаками. Если связь между признаками линейная, то коэффициент Пирсона определяет тесноту этой связи с высокой точностью. Корреляция Пирсона предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале.
Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:
рассматриваемые переменные должны быть обязательно получены в шкале отношений или интервальной шкале;
распределения переменных X и Y должны быть близки к нормальному;
количество варьирующих признаков переменной X должно совпадать с количеством варьирующих признаков переменной Y
Слайд 102

Формула для вычисления коэффициента корреляции Пирсона В случае двух переменных коэффициент

Формула для вычисления коэффициента корреляции Пирсона

В случае двух переменных коэффициент корреляции

вычисляется по следующей формуле:
где
Слайд 103

Корреляционный анализ в SPSS

Корреляционный анализ в SPSS

Слайд 104

Запуск программы вычисления

Запуск программы вычисления

Слайд 105

Результаты обработки (фрагмент)

Результаты обработки (фрагмент)

Слайд 106

Коэффициентом ранговой корреляции Спирмена называют непараметрический метод, используемый при статистическом исследовании

  Коэффициентом ранговой корреляции Спирмена называют непараметрический метод, используемый при статистическом

исследовании связи между различными явлениями. Два количественных ряда признаков имеют некоторую степень параллелизма. Именно эта степень и определяется  с целью получения оценки тесноты установленной связи. Метод ранговой корреляции Спирмена позволяет определять тесноту (или силу) и направление корреляционной связи между двумя профилями признаков или признаками. Для расчета коэффициента ранговой корреляции Спирмена выделяют следующие действия:
каждому из признаков присваивается порядковый номер (ранг). Ранг может присваиваться как по возрастанию, так и по убыванию;
определяется разность рангов каждой пары сопоставляемых значений;
каждая разность возводится в квадрат, а полученные результаты затем суммируются
Слайд 107

Таблица сопряженности признаков, измеренных в ранговой шкале (связь статуса преподавателя и

Таблица сопряженности признаков, измеренных в ранговой шкале (связь статуса преподавателя и

количества публикаций в научных журналах)


В таблице серым цветом выделены графы для подсчета ρ – Спирмена, голубым - для вычисления
τ-Кендала

Слайд 108

Коэффициент корреляции Спирмена Пример вычисления где: di разность пар рангов для

Коэффициент корреляции Спирмена
Пример вычисления
где: di разность пар рангов для i-го объекта,


n – число пар рангов.
(см. таблицу сопряженности признаков)
Слайд 109

Для вычисления коэффициента ранговой корреляции Кендала выделим пару объектов и сравним

Для вычисления коэффициента ранговой корреляции Кендала выделим пару объектов и сравним

их ранги по одному признаку и по другому (см. таблицу сопряженности). Если по данному признаку ранги образуют прямой порядок (т.е. порядок натурального ряда), то паре приписывается +1, если обратный, то –1. Для выделенной пары соответствующие плюс – минус единицы (по признаку X и по признаку Y) перемножаются. Результат, очевидно, равен +1; если ранги пары обоих признаков расположены в одинаковой последовательности, и –1, если в обратной.  Если порядки рангов по обоим признакам у всех пар одинаковы, то сумма единиц, приписанных всем парам объектов, максимальна и равна числу пар.
Слайд 110

Коэффициент корреляции Кендала Пример вычисления Где берутся из таблицы сопряженности

Коэффициент корреляции Кендала
Пример вычисления
Где берутся из таблицы сопряженности

Слайд 111

gh

gh

Слайд 112

Запуск вычислений

Запуск вычислений

Слайд 113

Пример решения задачи с использованием SPSS

Пример решения задачи с использованием SPSS

Слайд 114

Частные корреляции Если удалось установить тесную зависимость между двумя исследуемыми величинами,

Частные корреляции

Если удалось установить тесную зависимость между двумя исследуемыми величинами, отсюда

ещё непосредственно не следует их причинная взаимообусловленность. Из причинной связи величин следует стохастическая связь, из стохастической связи не всегда следует причинная.
За счет эффектов одновременного влияния неучтенных факторов на исследуемые переменные может искажаться смысл истинной связи между переменными. Например, подсчеты приводят к положительному значению коэффициента корреляции между парой случайных величин, в то время как истинная связь между ними имеет отрицательный смысл. Такую корреляцию между двумя переменными часто называют «ложной». Более детально подобные ситуации — обнаружение и исключение «общих причинных факторов», расчет «очищенных» или частных коэффициентов корреляции — исследуют методами многомерного корреляционного анализа.
Слайд 115

Исключить влияние третьей переменной позволяет частный коэффициент корреляции. Частным коэффициентом корреляции

Исключить влияние третьей переменной позволяет частный коэффициент корреляции. Частным коэффициентом корреляции

между случайными величинами x и y при исключении влияния случайной величины называется
где — коэффициенты корреляции Пирсона между случайными величинами x, y, z.
Если переменная Z не влияет, то из формулы видно, что .
Слайд 116

Пример вычислений

Пример вычислений

Слайд 117

Сравнение результатов вычисления общего и частного коэффициентов корреляции

Сравнение результатов вычисления общего и частного коэффициентов корреляции

Слайд 118