Презентации по Математике

Многомерный анализ данных ( лекция 9)
Многомерный анализ данных ( лекция 9)
Что такое data mining? Это процесс нетривиального извлечения новой, полезной и экстраполируемой информации из большого массива многомерных данных. Другими словами, это поиск структуры в данных. Исходные данные – совокупность численных векторов (измерений) Пример. Набор данных iris – 150 наблюдений, представляющих три вида ирисов (50 наблюдений для каждого). Каждый ирис – это вектор вида (Длина_чашелистика, Ширина_чашелистика, Длина_лепестка, Ширина_лепестка). Каждый ирис – точка в четырёхмерном пространстве.   versicolor virginica setosa Классификация многомерных методов Визуализация Классификация Визуализация «сырых» данных (данные как они есть) Методы понижения размерности Деревья принятия решений … Анализ главных компонент Кластеризация Простая визуализация «сырых» данных: ВОПРОС: какой из видов ирисов более «другой», чем остальные?
Продолжить чтение
Математическая статистика (лекция 6)
Математическая статистика (лекция 6)
Проверка распределения на нормальность 1000 случайных значений, распределённых по нормальному закону с μ=20 и σ=5 Синяя линия – кривая плотности идеального нормального распределения с μ=20 и σ=5 Любые экспериментальные данные всегда отклоняются от «сферического нормального распределения в вакууме»! Вероятности, не частоты Отклонения от идеала Quantile-Quantile plot (Q-Q Plot) Квантиль – значение, которое делит упорядоченную выборку на несколько равных частей Предсказанные значения по норм.распр Выборочные значения Середина распределения Значений здесь больше, чем должно быть для н.р. Значений здесь меньше, чем должно быть для н.р. Формальные тесты на нормальность Визуализация (гистограмма или Q-Q plot) позволяют определить, в каких конкретно точках выборочные значения отклоняются от нормального распределения. При этом Q-Q plot предпочтительней, когда наблюдений мало. Формальные тесты отвечают на вопрос, нормально ли распределение в принципе. Тест Шапиро-Уилкса H0: выборка распределена по нормальному закону (☺) H1: выборка распределена по нормальному закону (☹) Если p-value>0,05 – распределение соответствует нормальному закону (☺) Тест Колмогорова-Смирнова H0: случайная величина X (значения признака в выборке) имеет распределение F(X) (нормальное распределение – частный случай) H1: её распределение отличается от F(X) => Если p-value>0,05 – случайная величина имеет распределение F(X)
Продолжить чтение
Случайные величины (лекция 3)
Случайные величины (лекция 3)
Дискретная случайная величина Случайная величина – величина, которая в результате испытания принимает одно и только одно возможное значение, наперёд не известное и зависящее от случайных обстоятельств, которые заранее не могут быть учтены. Пример. Выпадение определённого числа очков на игральной кости (от 1 до 6). Число очков – случайная величина. Дискретная случайная величина – случайная величина, которая может принимать конечные, изолированные значения из некоторого числового промежутка Непрерывная случайная величина – случайная величина, которая может принимать все значения из некоторого числового промежутка Пример. Содержание какого-либо фермента в крови Закон распределения вероятностей дискретной случайной величины – это сопоставление всех возможных значений случайной величины и их вероятностей. Тривиальный пример. Случайная величина – сторона монетки. Она принимает два изолированных значения – либо «орёл», либо «решка» и подчинена следующему закону распределения: Название случайной величины Вектор вероятностей Способы задания распределения вероятностей дискретной случайной величины Таблично Из ящика, в котором лежат 2 белых и 8 чёрных шаров, последовательно вынимают шары до тех пор, пока не появится чёрный шар. Число вынутых шаров – есть дискретная случайная величина X, которая может принимать изолированные значения на промежутке от 1 до 3. Зададим закон её распределения таблично. Графически Аналитически Многоугольник распределения дискретной случайной величины, принимающей изолированные значения на промежутке от 0 до 3.
Продолжить чтение
Теория вероятностей и комбинаторные правила для решения задачи ЕГЭ В4
Теория вероятностей и комбинаторные правила для решения задачи ЕГЭ В4
Классическое определение вероятности Стохастическим называют опыт, если заранее нельзя предугадать его результаты. Результаты (исходы) такого опыта называются событиями. Пример: выбрасывается игральный кубик (опыт); выпадает двойка (событие). Событие, которое обязательно произойдет в результате испытания, называется достоверным, а которое не может произойти, - невозможным. Пример: В мешке лежат три картофелины. Опыт – изъятие овоща из мешка. Достоверное событие – изъятие картофелины. Невозможное событие – изъятие кабачка. Классическое определение вероятности Несовместимыми (несовместными) называют события, если наступление одного из них исключает наступление других. Пример: 1) В результате одного выбрасывания выпадает орел (событие А) или решка (событие В). События А и В - несовместны. 2) В результате двух выбрасываний выпадает орел (событие А) или решка (событие В). События А и В - совместны. Выпадение орла в первый раз не исключает выпадение решки во второй
Продолжить чтение