Первоначальные понятия математической статистики.Выборка,её объём.Представление данных

Содержание

Слайд 2

Определение Современную математическую статистику определяют как науку о принятии решений в

Определение

Современную математическую статистику определяют как науку о принятии решений в

условиях неопределённости.
Неопределенность не означает незнания, просто она предполагает, что точное определение исхода эксперимента невозможно
Слайд 3

Задача математической статистики состоит в создании методов сбора и обработки статистических

Задача математической статистики состоит в создании методов сбора и обработки статистических

данных для получения научных и практических выводов.
Математическая статистика возникла в XVII веке и развивалась параллельно с теорией вероятностей.
Дальнейшее развитие (вторая половина XIX века – начало XX века) обязано, в первую очередь,
П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову, а так же К. Гауссу, А. Кетле, Ф. Гальтону, К. Пирсону и другие. XX век – советские учёные :
В. И. Романовский, Е. Е. Слуцкий, А. Н. Колмогоров. Английские: Стьюдент, Фишер, Смирнов. Американские:С. Нейман, Вальд.
Слайд 4

Статистическая совокупность Полученные в ходе выполнения ряда независимых опытов значения случайной

Статистическая совокупность

Полученные в ходе выполнения ряда независимых опытов значения случайной величины

представляют собой простую статистическую совокупность, или статистический ряд, подлежащий обработке и научному анализу.
Статистическая совокупность представляет собой множество объектов, однородных относительно некоторого качественного или количественного признака, характеризующего эти объекты.
Слайд 5

В общем смысле под словом «признак» подразумевают свойство, проявлением которого один

В общем смысле под словом «признак» подразумевают свойство, проявлением которого

один предмет отличается от другого ( в биологии: характерные особенности в строении и функциях живого).
Качественные: окраска шерстяного покрова, пол животного, тип телосложения, масти лошадей (серые, вороные, гнедые, пёстрые и другие), цвет глаз и волос.
Слайд 6

Альтернативные признаки: женщина и мужчина, высокий и низкий. Количественные признаки поддаются

Альтернативные признаки: женщина и мужчина, высокий и низкий.
Количественные признаки поддаются непосредственному

измерению или счёту. Их делят на мерные и счётные.
Мерные признаки: мясная и молочная продуктивность животных, содержание жира и белка в молоке, живая масса.
Счётные признаки: плодовитость, яйценоскость и другие.
Слайд 7

Генеральная и выборочная совокупности Совокупность, состоящая из всех объектов, которые могут

Генеральная и выборочная совокупности

Совокупность, состоящая из всех объектов, которые могут быть

к ней отнесены на основании однородности некоторого признака, называется генеральной.
Множество объектов, случайно отобранных из генеральной совокупности, называется выборочной совокупностью или выборкой. Число объектов выборки называют её объемом и обозначают n
Слайд 8

Репрезентативность выборки Для того чтобы по данным выборки можно было достаточно

Репрезентативность выборки

Для того чтобы по данным выборки можно было достаточно уверенно

судить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли.
Для того чтобы выборка достаточно хорошо отражала свойства генеральной совокупности, она должна быть представительной (репрезентативной). Репрезентативность выборки достигается случайным отбором объектов из генеральной совокупности.
Каждый объект выборки считается отобранным из генеральной совокупности случайно, если все объекты имеют одинаковую вероятность попасть в выборку.
Слайд 9

Существует два основных способа отбора объектов из генеральной совокупности: повторный и

Существует два основных способа отбора объектов из генеральной совокупности: повторный и

бесповторный. Если выборку отбирают по одному объекту, который обследуют и снова возвращают в генеральную совокупность, то выборка является повторной. Если выборка не возвращается в генеральную совокупность, то она является бесповторной.
Если в выборку входит до 30 членов (n<30), она называется малой, если более 30(n>30) – большой.
Слайд 10

Характерным свойством биологических признаков является варьирование величины признаков в определённых пределах

Характерным свойством биологических признаков является варьирование величины признаков в определённых пределах

при переходе от одной единицы наблюдений к другой. Эти колебания величины одного и того же признака, наблюдаемые в массе однородных членов статистической совокупности, называют вариациями ( от латинского variatio – изменение, колебания), а отдельные числовые значения варьирующего признака принято называть вариантами (от латинского variants, variantis - различимый, изменяющийся)

Характерным свойством биологических признаков является варьирование величины признаков в определённых пределах при переходе от одной единицы наблюдений к другой. Эти колебания величины одного и того же признака, наблюдаемые в массе однородных членов статистической совокупности, называют вариациями ( от латинского variatio – изменение, колебания), а отдельные числовые значения варьирующего признака принято называть вариантами (от латинского variants, variantis - различимый, изменяющийся)

Слайд 11

Для случая, когда количественный признак является дискретной величиной, его значения хi

Для случая, когда количественный признак является дискретной величиной, его значения хi

и соответствующие им частоты ni или относительные частоты wi представляют в виде таблицы, в которой значения признака (варианты) располагаются в порядке возрастания.
, где ni - это число повторений варианта
Такие таблицы называют статистическим дискретным рядом распределения или дискретным вариационным рядом.
Слайд 12

Вариационным рядом или рядом распределения называют двойной ряд чисел, показывающий, каким

Вариационным рядом или рядом распределения называют двойной ряд чисел, показывающий, каким

образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности. Общая сумма частот вариационного ряда равна объёму данной совокупности, т.е.


Слайд 13

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или

графика накопленных частот (кумулята).

Полигоном частот называют ломаную линию, отрезки которой соединяют точки (xi, ni).
Полигоны обычно служат для изображения выборки в случае дискретной случайной величины.
Пример. В результате измерения температуры у 12 животных получены следующие значения: 37,8; 37,8; 38; 37,7; 37,9; 37,8; 37,5; 37,7; 37,6; 38; 38,1; 37,9. Требуется построить вариационный ряд и соответствующий ему полигон.

Слайд 14

Xi 37,5 37,6 37,7 37,8 37,9 38 38,1 ni 1 1 2 3 2 2 1

Xi 37,5 37,6 37,7 37,8 37,9 38 38,1 ni 1 1 2

3 2 2 1
Слайд 15

В случае большого количества вариантов и непрерывного распределения признака статистическое распределение

В случае большого количества вариантов и непрерывного распределения признака статистическое распределение

признака можно задать в виде последовательности интервалов и соответствующих им частот или относительных частот. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на определенное количество частных интервалов (x0; x1]; (x1; x2]; …; (xk-1; xk] длиной h и находят для каждого частичного интервала сумму частот вариант .
Для графического изображения интервального ряда распределения используют гистограммы.
Слайд 16

Гистограмма относительных частот (или просто гистограмма) - ступенчатая фигура, состоящая из

Гистограмма относительных частот (или просто гистограмма) - ступенчатая фигура, состоящая из

прямоугольников, основаниями которых служат частичные интервалы длинною h, а высоты равны i /h (или i) . Площадь гистограммы равна единице.

fi = -плотность относительных частот.
- длина соответствующего интервала
К=1+3,32ּlg(n) - количество классов (интервалов)

Слайд 17

Слайд 18

Слайд 19

Гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения fi (x).

Гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения fi (x).

Если у теоретического распределения F существует конечная плотность, то эмпирическая плотность является некоторым приближением для теоретической. В этом и состоит практическая польза гистограммы.
Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные относительные частоты, т.е. .
Эти величины не убывают, и таким образом график накопленных частот имеет вид ступенчатой “лестницы”
(от 0 до 1).