ОБРАБОТКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ И ЭКСПЕРИМЕНТОВ

Содержание

Слайд 2

Цель Целью данной главы является ознакомление исследователя с основными методами статистической

Цель

Целью данной главы является ознакомление исследователя с основными методами статистической

обработки данных, а также с некоторыми приемами современной прикладной математики.
Слайд 3

Схема экспериментального исследования и типы обработки результатов

Схема экспериментального исследования и типы обработки результатов

Слайд 4

Дана упрощенная схема экспериментального исследования

Дана упрощенная схема экспериментального исследования

Слайд 5

Обозначая через вектор входа, будем в дальнейшем представлять его массивом х

Обозначая через вектор входа, будем в дальнейшем представлять его массивом х

= х[n0, nf], представленным в виде матрицы,

где n0 — число опытов;
nf — число факторов;
— вектор выхода, чаще всего предста­вляемый в виде единичного вектора
a — вектор помех (погрешностей).

На том же рисунке указаны обратные связи, которые следует иметь в виду в любом измерительном процессе, хотя их влияние зависит от конкретных условий.

Слайд 6

Например, ясно, что влияние измерительного прибора-термометра на температуру жидкости в большом

Например, ясно, что влияние измерительного прибора-термометра на температуру жидкости в большом

баке несравнимо мало в сравнении с таким же влиянием на ее температуру, если жидкость находится в стакане.

Перед тем, как приступить к эксперименту, исследователь должен уметь ответить на следующие вопросы:

что мерить?
чем мерить?
где мерить?
какова точность измерений?
что делать с результатами измерений?

Слайд 7

Например , измерение температуры термометром или измерение скорости через длину отрезка

Например , измерение температуры термометром или измерение скорости через длину отрезка

и времени его прохождения. Ясно, что методы определения погрешностей в этих случаях различные. Это обстоятельство еще осложняется и тем, что измерения могут производиться приборами с различной точностью (неравноточные измерения).
Слайд 8

Погрешности или ошибки в первом приближении классифицируются следующим образом: 1. Грубые,

Погрешности или ошибки в первом приближении классифицируются следующим образом:

1. Грубые, или

промахи. Они относительно легко определяются по их отклонению от среднего значения на основании "правила 3σ".

2. Систематические, учитывающие тарировку измерительного прибора.

3. Случайные, являющиеся следствием многих мелки факторов. Часто они подчиняются закону нормального распределения (закону Гаусса), хотя в каждом конкретном случае требуется проверка.

Слайд 9

Типы обработки результатов измерений

Типы обработки результатов измерений

Слайд 10

Задачи обработки опытных данных условно можно разбить на две группы: 1.

Задачи обработки опытных данных условно можно разбить на две группы:

1.

Определяется значение одной величины х. Для этого производится ряд опытов, в результате которых измеряю значения этой неизвестной величины.

2.Определяется связь между зависимой переменной у и одним или несколькими вектор-факторами х. Эта связь может быть качественной и количественной.

Слайд 11

Определение значений одной величины

Определение значений одной величины

Слайд 12

Пример В табл. 1 приведены результаты измерения некоторой величины. Требуется определить

Пример
В табл. 1 приведены результаты измерения некоторой величины. Требуется определить

доверительные интервалы в зависимости от значения принятой вероятности ( Р=0,95 и Р=О,99) и числа степеней свободы (f = n0-1).
Слайд 13

Производим вычисления х = 172,6/16 = 10,76;

Производим вычисления

х = 172,6/16 = 10,76;

Слайд 14

По таблицам Стьюдента-Фишера находим, что при f = 15 и Р

По таблицам Стьюдента-Фишера находим,

что при f = 15 и Р

= 0,95 t = 1,753 и при f = 15 и Р = 0,99 t = 2,947, а доверительные интервалы [10,76-0,12; 10,76+0,12] и [10,76-0,20;10,76+0,20] соответствующим образом накроют истинное значение измеряемой величины х с вероятностями Р = 0,95 и Р = 0,99 соответственно.
Слайд 15

Рассмотрим обратную задачу. Пусть даны доверительные интервалы Д=±10% и Р=0,95. Требуется

Рассмотрим обратную задачу.

Пусть даны доверительные интервалы Д=±10% и Р=0,95. Требуется

таким образом определить выборочную среднюю , чтобы генеральная средняя величина попадала в интервал х ± Д. При этом желательно произвести минимальное число опытов.
Слайд 16

Составим с этой целью таблицу 2, заполняя ее строки, начиная а

Составим с этой целью таблицу 2, заполняя ее строки, начиная а

второй, по приведенным выше формулам. Далее, по числу степеней свободы f = n0 -1 и значению t находим вероятность Р (по таблице Стьюдента).

Таблица 2

Слайд 17

Из данных таблицы 2 видно, что Р вначале колеблется, а при

Из данных таблицы 2 видно, что Р вначале колеблется, а

при n0=6 его значение стабилизируется, достигая значения Р = 0,95. Два последующих опыта подтверждают полученный вывод.
Слайд 18

В тех случаях, когда х меняется в больших пределах строят гистограмму

В тех случаях, когда х меняется в больших пределах строят

гистограмму и определяют числовые моменты более высокого порядка, по которым судят о типе распределения случайной величины х.
Слайд 19

Определение связи

Определение связи

Слайд 20

Качественные исследования - анализ влияния некоторых факторов на выходную величину тогда,

Качественные исследования - анализ влияния некоторых факторов на выходную величину тогда,

когда эти факторы нельзя представить численно.

Количественные исследования имеют место тогда, когда результаты наблюдения или опытов могут быть представлены в виде зависимости y=f (х1, х2,…, хnf).

Слайд 21

Рассмотрим сущность МНК на примере линейной функции у = а0+а1х, для

Рассмотрим сущность МНК на примере линейной функции у = а0+а1х, для

которой заданы наборы значений фактора хi и соответствующие уi.

Требуется найти значение коэффициентов многочлена а0 и а1, таким образом, чтобы сумма квадратов невязок (отклонений) Δ = уi –yai была минимальной.

Слайд 22

Для этого следует минимизировать величину

Для этого следует минимизировать величину

Слайд 23

необходимо выполнить условия или

необходимо выполнить условия

или

Слайд 24

После дифференцирования и упрощения выражений получим систему уравнений

После дифференцирования и упрощения выражений получим систему уравнений

Слайд 25

Статистическая проверка гипотез. Критерии оценки качества аппроксимации

Статистическая проверка гипотез. Критерии оценки качества аппроксимации

Слайд 26

Статистическая проверка гипотез Рассмотрим этот метод на примере однофакторного дисперсионного анализа.

Статистическая проверка гипотез

Рассмотрим этот метод на примере однофакторного дисперсионного анализа.

Пусть имеется ряд значений случайной величины, которая изменяется за счет влияния какого-то признака при следующих обозначениях:

n0 — общее число наблюдений;
nq — число групп, т.е. число значений признака;
nj— число значений в каждой группе;
— общее среднее значение;
— групповое среднее.

Слайд 27

Сумму квадратов результатов наблюдений SCt можно представить в виде суммы квадратов

Сумму квадратов результатов наблюдений SCt можно представить в виде суммы квадратов

SCi внутри каждой группы вокруг группового среднего

и суммы квадратов этих средних величин вокруг общего среднего значения

Слайд 28

Эти выражения можно представить в другом виде

Эти выражения можно представить в другом виде

Слайд 29

Для вычисления на компьютере: где SCe — доля общей суммы квадратов,

Для вычисления на компьютере:

где SCe — доля общей суммы квадратов,

объясняемая гипотезой и возникающая из-за изменения признака; SCi — сумма квадратов, характеризующая неучтенные факторы и другие причины.
Слайд 30

Суммы квадратов сопоставляются с учетом степеней свободы. Оценки дисперсии равны соответственно

Суммы квадратов сопоставляются с учетом степеней свободы.

Оценки дисперсии равны соответственно


В тех случаях, когда SCe ≈ SCt, ошибок нет и аппроксимация "точная". Если же признак не влияет на значение случайной величины, то , т.е. это величины одного порядка.

Слайд 31

Общий случай Дано: генеральная совокупность и две выборки объема n1 и

Общий случай

Дано: генеральная совокупность и две выборки объема n1 и

n2. Мы хотим проверить гипотезу H0 – являются ли две эти выборки частями одной генеральной совокупности или же верна альтернативная гипотеза H1 о том, что они не принадлежат одной генеральной совокупности.
Слайд 32

Общий случай - дисперсия - выборочные дисперсии 1 и 2 и

Общий случай

- дисперсия

- выборочные дисперсии 1 и 2

и

В математической

статистике рассматриваются случайные величины

и

, которые распределены по закону

соответственно с

и

степенями свободы

Вводится критерий F (Фишера), определяемый соотношением:

Слайд 33

Оценка адекватности аппроксимации эмпирического выражения Как известно, при линейной аппроксимации у=а0+а1х

Оценка адекватности аппроксимации эмпирического выражения

Как известно, при линейной аппроксимации у=а0+а1х для

оценки ее качества используют коэффициент корреляции

или r = a1Sx/Sy.

Слайд 34

Существуют и более эффективные критерии оценки аппроксимации. Например, выдвигая гипотезу Н0

Существуют и более эффективные критерии оценки аппроксимации.

Например, выдвигая гипотезу Н0

о той что ошибка аппроксимации Sa и ошибка эксперимента Sе величины одного порядка, т.е. взяты из одной генеральной совокупности, а также учитывая, что
Слайд 35

а величина Se определяется из опыта, где nk число коэффициентов аппроксимирующего

а величина Se определяется из опыта, где nk число коэффициентов аппроксимирующего

выражения, для принята гипотезы или отказа от нее применяют F-критерий Фишера
Слайд 36

Второй критерий базируется на использовании выражении характеризующего относительное уменьшение неопределенности при аппроксимации статистических данных эмпирческой формулой.

Второй критерий базируется на использовании выражении

характеризующего относительное уменьшение неопределенности при аппроксимации

статистических данных эмпирческой формулой.
Слайд 37

Величина критерия І2 находится в диапазоне 0÷1 и чем ближе к

Величина критерия І2 находится в диапазоне 0÷1 и чем ближе к

единице это значение, тем меньше разногласие между статистическими данными и аппроксимацией. На практике используют критерии

в котором поправка ft / fi = (n0-1) / (n0-nk) указывает на то, что имеем дело с небольшим числом степеней свободы. Благодаря этому оценка становится несмешанной.

Слайд 38

Отметим, что дисперсия аппроксимации при малых fi=n0-nk может стать больше, чем

Отметим, что дисперсия аппроксимации

при малых fi=n0-nk может стать больше, чем

, и тогда его величина определяется алгоритмически:
Слайд 39

Применение относительной ошибки для оценки аппроксимации Часто возникает вопрос о целесообразности

Применение относительной ошибки для оценки аппроксимации
Часто возникает вопрос о целесообразности

многократного повторения опытов для нахождения экспериментальной дисперсии. В этой связи может возникнуть вопрос о том, не лучше ли дополнительные опыты проводить, равномерно распределяя их по экспериментальному полю? Таким образом, иногда можно еще получить данные об экстремальных областях по зависимому параметру.
Слайд 40

Применение относительной ошибки для оценки аппроксимации Обозначим через V∞ (%) допустимую

Применение относительной ошибки для оценки аппроксимации

Обозначим через V∞ (%) допустимую

вариацию или относительную ошибку (2, 3 или 8%). При обработке данных находим относительную ошибку данного эксперимента или наблюдения по формуле

V=Sa/Ycp·100%,

где дисперсия аппроксимации

а величины уi и yai выражают соответственно опытные и расчетные значения зависимой величины.

Слайд 41

При числе степеней свободы f = n0-nk → ∞, т.е. исходя

При числе степеней свободы f = n0-nk → ∞, т.е. исходя

из предположения, что символ ∞ является результатом многочисленных ранее проводимых опытных исследований, имеем

V∞= S∞ / Ycp,

Слайд 42

Для удобства пользования зависимость F=V2/V2∞ можно представить графически.

Для удобства пользования зависимость F=V2/V2∞ можно представить графически.

Слайд 43

На рисунке приведен график критерия Фишера, где по оси абсцисс f1=fa

На рисунке приведен график критерия Фишера, где по оси абсцисс f1=fa

откладывается число степеней свободы числителя аппроксимации, а по оси ординат — вариация аппроксимации V(%).

Кривые V(%) соответствуют верхнему пределу области V ≤ √FtV∞ , в которой гипотеза принимается.

Слайд 44

Математическое обеспечение для обработки результатов наблюдений и экспериментов

Математическое обеспечение для обработки результатов наблюдений и экспериментов

Слайд 45

В пределах настоящего курса не ставилась цель показать все множество формул,

В пределах настоящего курса не ставилась цель показать все множество формул,

процедур и программ современной прикладной математики для обработки результатов экспериментов. Ограничимся некоторыми программами, которые на практике оказались очень эффективными для решения широкого класса задач.

Для качественного анализа предлагается небольшая программа "ДИСПЕРСИЯ", в которой решается задача дисперсионного анализа при одном признаке. Программы ТОЛИНОМ", "МИНИ", "ФКВ" и "ФИЛЬТР" служат для обработки числовых данных, а программа "УРАВНЕНИЕ" - для решения уравнений.

Слайд 46

Программа "ПОЛИНОМ" Программа "Полином" предназначена для получения статистических (регрессионных) зависимостей ya=F(х1,...,ХHF)

Программа "ПОЛИНОМ"

Программа "Полином" предназначена для получения статистических (регрессионных) зависимостей ya=F(х1,...,ХHF)

величины уа ряда независимых величин-факторов, Эта зависимость чаще всего имеет вид многочлена

где искомые коэффициенты аij (входящие линейно) определяются по методу наименьших квадратов.

Слайд 47

Программа может быть использована и для нелинейных случаев при соответствующей линеаризации.

Программа может быть использована и для нелинейных случаев при соответствующей линеаризации.
Особенность

программы заключается в том, что вид многочлена (количество и тип членов) задается пользователем путем введения матрицы индексов MI.

Работа программы определяется четырьмя исходными параметрами:

числом факторов - nf≥0

числом опытов (или наблюдений) – no>0

числом определяемых коэффициентов - nk≥1

числом индексов в каждом члене полинома - ni≥1

Слайд 48

Программа "Мини" Программа предназначена для поиска минимума функции любого типа: линейной

Программа "Мини"

Программа предназначена для поиска минимума функции любого типа: линейной

или нелинейной, с ограничениями или без. В программу "МИНИ" включена подпрограмма "ГРАДИЕНТ", которая позволяет решать простые случаи поиска экстремума (минимума).
Слайд 49

Подпрограмма "Шаг" Эта подпрограмма является основным элементом детерминированного метода, в котором

Подпрограмма "Шаг"

Эта подпрограмма является основным элементом детерминированного метода, в котором

происходит поиск локального минимума функции φ .
Слайд 50

"ФКВ" - программа фильтрации исходных данных, корреляции между независимыми факторами и

"ФКВ" - программа фильтрации исходных данных, корреляции между независимыми факторами и

оценки их влияния

Часто при обработке наблюдений или экспериментальных результатов необходимо провести фильтрацию исхоных данных - элементов массива факторов x (no, nf) зависимой величины у (nо). Фильтрация данных обозначает определение грубых ошибок или промахов, которые не следует учитывать при дальнейшей обработке.

Слайд 51

Иногда при проведении наблюдений или при неправильно спланированном эксперименте имеет место

Иногда при проведении наблюдений или при неправильно спланированном эксперименте имеет место

сильная корреляция между "независимыми факторами. Не учет этой корреляции может привести к получению плохо обусловленной матрицы при использовании программы "ПОЛИНОМ" и искаженным выводам при любом методе обработки.
Слайд 52

Наконец, часто бывает полезным оценивать влияние независимых переменных х (no ,

Наконец, часто бывает полезным оценивать влияние независимых переменных х (no ,

nf ) на зависимую у (nо) до подробной их обработки. Такую оценку можно осуществить при помощи дисперсионного анализа.

Таким образом, программа "ФКВ" позволяет решать задачи дисперсионного анализа и состоит из трех основных частей.

Слайд 53

Программа «Дисперсия» Дисперсионный анализ служит для оценки влияния на какой-то процесс

Программа «Дисперсия»

Дисперсионный анализ служит для оценки влияния на какой-то процесс факторов,

которые не могут быть представлены числами.
Слайд 54

Например, если требуется оценить точность измерения одной и той же величины

Например, если требуется оценить точность измерения одной и той же величины

различными аппаратами А, В, С,… и т.д., тогда

SC=SCt+SCe,

т.е. общая сумма квадратов отклонений равна внутригрупповой сумме квадратов сложенной с межгрупповой суммой квадратов отклонений между расчетными значениями и опытными

При помощи этой программы определяются эти суммы и критерии Фишера F

Слайд 55

Программа "УРАВНЕНИЕ" Эта программа служит для решения линейных или нелинейных уравнений

Программа "УРАВНЕНИЕ"

Эта программа служит для решения линейных или нелинейных уравнений

методом половинного деления. Предлагаемый вариант построен по следующей схеме. Даны пределы области, где имеются один или более корней уравнения. Начиная с нижнего предела с заданным шагом решается уравнение на примере
y=1/x + LOC(x)-2=O.
Слайд 56

Если знак двух последующих значений у одинаковый, ход действия продолжается еще

Если знак двух последующих значений у одинаковый, ход действия продолжается еще

на одни шаг. Если знак меняется, программа переходит к подпрограмме, где происходит деление шага пополам и дальнеший ход производится согласно операторам 300-400. Операция деления интервала заканчивается тогда, когда абсолютное значение величины у становится меньше допустимой ошибки.

Решаемое уравнение вводится в оператор в форме DEF FNY = f(x)

Слайд 57

Программа "Фильтр" Эта программа предназначена для решения следующей задачи. Дана запись

Программа "Фильтр"

Эта программа предназначена для решения следующей задачи. Дана запись некоторой

величины у (например, траектория элемента машины в движении). Выписываем ряд значений у через равные интервалы. Этот выбор значения у назовем экспериментальными точками. Из-за вибрации ряд у имеет скачки и неровности, что требует сглаживания данных.