- Главная
- Математика
- Предварительный анализ данных. Описательные статистики
Содержание
- 2. Исходные данные Задача 1. Найти для вычисленной функции y=f(x) среднее арифметическое, среднее геометрическое (если возможно) и
- 3. Задача 2. Построение гистограмм для ряда данных y, полученного в Задаче 1. Подсказка Создать «Массив_интервалов», т.е.
- 4. 1.7. Вычислить относительные частоты (разделить значения из столбца с абсолютными частотами на их сумму и умножить
- 5. Задача 3 Воспользуйтесь пакетом «Анализ данных» в MS Excel и с помощью инструмента «Описательная статистика» рассчитайте
- 6. 3. В новом диалоговом окне указать: - входной интервал - вывод результатов на новый рабочий лист,
- 7. Задача 5 Вычислить набор характеристик, полученных автоматически с помощью «Анализ данных-Описательная статистика», с помощью исходных формул.
- 8. б) Стандартная ошибка - среднеквадратическое отклонение выборочного среднего σ в) Дисперсия выборки σВ2 г) Коэффициент вариации
- 9. Задача 6 Найти квартили Q1, Q2, Q3 Подсказка 1) Создать новый лист Квартили и результаты представлять
- 11. Скачать презентацию
Исходные данные
Задача 1.
Найти для вычисленной функции y=f(x) среднее арифметическое, среднее геометрическое
Исходные данные
Задача 1.
Найти для вычисленной функции y=f(x) среднее арифметическое, среднее геометрическое
Создать файл в Exсel: Фамилия_МСС_Пр01
Исходные данные (y=f(x)) вычислить согласно параметрам в
файле МСС_Пр01_Распределение (2018H2).xls
Проверить вычисление среднего арифметического и среднего
геометрического при помощи функций Excel: =СРЗНАЧ() и СРГЕОМ()
Задача 2.
Построение гистограмм для ряда данных y, полученного в Задаче 1.
Подсказка
Создать
Задача 2.
Построение гистограмм для ряда данных y, полученного в Задаче 1.
Подсказка
Создать
Для подготовки «Массива интервалов» найти:
1.1 Для оценки оптимального для нашего массива данных количества интервалов n можно воспользоваться
формулой Стерджесса: https://ru.wikipedia.org/wiki/Правило_Стёрджеса
n~1+[3,322*lgN]
N — количество всех значений величины (функция СЧЕТ в Excel).
lg - десятичный логарифм (функция LOG10 в Excel).
[x] — целая часть числа x (функция ОТБР в Excel)
1.2. Найти максимальное и минимальное значения y с помощью функций Excel: МАКС и МИН
1.3. Найти ширину интервала для «Массив_интервалов»: (МАКС-МИН)/n
1.4. Создаем столбец со значениями границ интервалов от (МИН+ширина интервала) до (МАКС-ширина интервала) с шагом равным вычисленной ширине. Получили массив границ интервалов
1.5. Выделяем ячейки рядом с интервалами (количество элементов в возвращаемом массиве на единицу больше количества элементов в аргументе массив_карманов), нажимаем «F2» и вводим функцию Excel
ЧАСТОТА(Массив_данных; Массив_интервалов) и нажать Ctr+Shift+Ener. В столбце напротив границ интервалов появилось количество значений исходного массива, которые попадают в интервалы.
1.6. Найти сумму частот. Проверить равенство суммы и ранее вычисленной величины N
1.7. Вычислить относительные частоты (разделить значения из столбца с абсолютными частотами
1.7. Вычислить относительные частоты (разделить значения из столбца с абсолютными частотами
1.8. Построить в Excel на отдельном листе D-Гист гистограмму (обычная - гистограмма с группировкой) для полученных распределений относительных частот.
«На отдельном листе»: щелкнуть право клавишей мыши на диаграмме и задать команду «Переместить диаграмму» как показано на рисунках ниже.
1.10. Сделать подпись вертикальной оси Относительная частота, %.
Сделать подписи горизонтальной оси Величина
1.11. Создать столбец с подписями границ диапазонов - текстовые значения вида «мин-макс.»
Нанести на диаграмму эти подписи под соответствующими столбцами
Задача 3
Воспользуйтесь пакетом «Анализ данных» в MS Excel и с
Задача 3
Воспользуйтесь пакетом «Анализ данных» в MS Excel и с
Подсказка
Воспользуйтесь пакетом «Анализ данных» в MS Excel и с помощью инструмента «Описательная статистика»
рассчитайте показатели
1. На вкладке «Данные» справа должна быть группа
Что делать, если группы нет смотри в конце презентации - Дополнение: если нет блока «Анализ» на вкладке «Данные»
2. Щелкнуть мышкой на кнопке «Анализ данных».
В диалоговом окне выбрать «Описательная статистика»
3. В новом диалоговом окне указать:
- входной интервал
- вывод результатов на
3. В новом диалоговом окне указать:
- входной интервал
- вывод результатов на
ОпСтат
отметить галочками Итоговая статистика и
Уровень надежности, для последнего указать 95% (95% вычисляет уровень надежности
среднего со значимостью 0.05)
- К-наибольший = 2
- К-наименьший = 2
Задача 4
Вычислить набор характеристик, полученных автоматически с помощью
«Анализ данных-Описательная статистика», с помощью встроенных функций Excel.
Сравнить полученные результаты
Подсказка
1. Работать на листе ОпСтат и создав новый столбец Расчет, где вычислять с помощью
встроенных функций Excel
Использовать функции: https://support.office.com/ru-ru/article/Функции-Excel-по-категориям-5f91f4e9-7b42-46d2-9bd1-63f26a86c0eb
(см. следующую страницу)
Задача 5
Вычислить набор характеристик, полученных автоматически с помощью
«Анализ данных-Описательная статистика»,
Задача 5
Вычислить набор характеристик, полученных автоматически с помощью
«Анализ данных-Описательная статистика»,
Подсказка
1. Вычислять следующие характеристики:
а) Стандартное отклонение (выборки) σВ
б) Стандартная ошибка - среднеквадратическое отклонение выборочного среднего σ
в) Дисперсия выборки
б) Стандартная ошибка - среднеквадратическое отклонение выборочного среднего σ
в) Дисперсия выборки
г) Коэффициент вариации
Задача 6
Найти квартили Q1, Q2, Q3
Подсказка
1) Создать новый лист Квартили и
Задача 6
Найти квартили Q1, Q2, Q3
Подсказка
1) Создать новый лист Квартили и
2) Использовать функцию КВАРТИЛЬ или КВАРТИЛЬ.ВКЛ
Квартили
Квартили — это показатели, которые чаще всего используются для оценки распределения данных при
описании свойств больших числовых выборок.
Медиана разделяет упорядоченный массив пополам (50% элементов массива меньше медианы и
50% — больше), квартили разбивают упорядоченный набор данных на четыре части.
Величины Q1, медиана и Q3 являются 25-м, 50-м и 75-м перцентилем соответственно.
Первый квартиль Q1 — это число, разделяющее выборку на две части: 25% элементов меньше, а 75% — больше первого квартиля.
Третий квартиль Q3 — это число, разделяющее выборку также на две части: 75% элементов меньше, а 25% — больше третьего квартиля.
Нулевой квартиль Q0 - минимальное значение выборки
Четвертый квартиль Q4 - максимальное значение выборки