Анализ данных с применением библиотек Python

Слайд 2

Подключаем или создаем среду разработки python

Подключаем или создаем среду разработки python

Слайд 3

Старый файл с данными

Старый файл с данными

Слайд 4

Новый файл python

Новый файл python

Слайд 5

Слайд 6

Внешние модули Модули надо установить в текущее окружение Подключить к программе

Внешние модули

Модули надо установить в текущее окружение
Подключить к программе
Среда PyCharm предлагает

СНАЧАЛА подключить модуль
Затем, если его нет в окружении – докачать через Интернет и установить
После скачивания среда тратит время на анализ модуля, это требует времени
Слайд 7

Слайд 8

Слайд 9

Слайд 10

Слайд 11

Добавьте (загрузите модули при необходимости) numpy as np scipy as sci

Добавьте (загрузите модули при необходимости)

numpy as np
scipy as sci
pandas as pd
Библиотека

печати
import matplotlib.pyplot as plt
Слайд 12

Чтение данных

Чтение данных

Слайд 13

Что неверно? Разделитель – точка с запятой Десятичная точка – запятая Лучше так data = pd.read_csv("data1.csv",sep=";",decimal=",")

Что неверно?

Разделитель – точка с запятой
Десятичная точка – запятая
Лучше так
data =

pd.read_csv("data1.csv",sep=";",decimal=",")
Слайд 14

Слайд 15

Слайд 16

Слайд 17

Слайд 18

Такая структура, как фрейм данных pandas является близким аналогом фрейма из

Такая структура, как фрейм данных pandas является близким аналогом фрейма из

языка R
В частности, он сам «знает» что и как надо напечатать
Фрейм состоит из переменных (колонок), и строк
Существуют механизмы выбора отдельных колонок или их множества
Существуют инструменты отбора данных в колонках (например по условию)
Потенциально существует возможность поменять местами строки и столбцы (транспонировать таблицу)
Слайд 19

Слайд 20

Слайд 21

Слайд 22

Слайд 23

Слайд 24

Слайд 25

Расчет отдельных показателей print("Stat") print("average".center(64,"=")) print(data.median()) print("variance".center(64,"=")) print(data.var()) print("std dev".center(64,"=")) print(data.std())

Расчет отдельных показателей

print("Stat")
print("average".center(64,"="))
print(data.median())
print("variance".center(64,"="))
print(data.var())
print("std dev".center(64,"="))
print(data.std())

Слайд 26

Специальная таблица под статистику stat = pd.DataFrame() stat["Avg"] = data.mean() stat["Median"]

Специальная таблица под статистику

stat = pd.DataFrame()
stat["Avg"] = data.mean()
stat["Median"] = data.median()
stat["Variance"] =

data.var()
stat["Std dev"] = data.std()
print(stat)
print(stat.T)