CSV в Python

Содержание

Слайд 2

Программисты часто сталкиваются с задачей обработки больших объемов структурированных данных. Python

Программисты часто сталкиваются с задачей обработки больших объемов структурированных данных. Python имеет

встроенную библиотеку CSV, с помощью которой программист может работать со специальными CSV файлами. Это своего рода электронные таблицы.
Слайд 3

Что такое файлы CSV Файл CSV – это особый вид файла,

Что такое файлы CSV

Файл CSV – это особый вид файла, который

позволяет структурировать большие объемы данных.

07.12.2020

Пример CSV файла, где в качестве разделителя используется запятая:
Имя, Профессия, Год рождения
Виктор, Токарь, 1995
Сергей,Сварщик,1983

Слайд 4

Библиотека CSV Эта основная библиотека для работы с CSV файлами в

Библиотека CSV

Эта основная библиотека для работы с CSV файлами в Python.
Библиотека

csv является встроенной, поэтому её не нужно скачивать, достаточно использовать обычный импорт:

07.12.2020

Слайд 5

Чтение из файлов (парсинг) 07.12.2020

Чтение из файлов (парсинг)

07.12.2020

Слайд 6

Классы DictReader и DictWriter 07.12.2020

Классы DictReader и DictWriter

07.12.2020

Слайд 7

Запись в файл 07.12.2020

Запись в файл

07.12.2020

Слайд 8

Запись в файл 07.12.2020

Запись в файл

07.12.2020

Слайд 9

Диалекты 07.12.2020

Диалекты

07.12.2020

Слайд 10

Диалекты 07.12.2020

Диалекты

07.12.2020

Слайд 11

Диалекты 07.12.2020

Диалекты

07.12.2020

Слайд 12

Диалекты 07.12.2020

Диалекты

07.12.2020

Слайд 13

Pandas Pandas — одна из самых популярных библиотек Python для аналитики

Pandas

Pandas — одна из самых популярных библиотек Python для аналитики и

работы с Data Science. Это как SQL для Python. Все потому, что pandas позволяет работать с двухмерными таблицами данных в Python. У нее есть и масса других особенностей. В этой серии руководств по pandas вы узнаете самое важное (и часто используемое), что необходимо знать аналитику или специалисту по Data Science. Это первая часть, в которой речь пойдет об основах.

07.12.2020

Слайд 14

Pandas Импортировать numpy и pandas в Jupyter Notebook с помощью двух

Pandas

Импортировать numpy и pandas в Jupyter Notebook с помощью двух строк

кода:

07.12.2020

Информация может храниться в файлах .csv или таблицах SQL. Возможно, в файлах Excel. Или даже файлах .tsv. Или еще в каком-то другом формате. Но цель всегда одна и та же. Если необходимо анализировать данные с помощью pandas, нужна структура данных, совместимая с pandas.

Слайд 15

Структуры данных Python 07.12.2020 В pandas есть два вида структур данных:

Структуры данных Python

07.12.2020

В pandas есть два вида структур данных: Series и

DataFrame.
Series в pandas — это одномерная структура данных («одномерная ndarray»), которая хранит данные. Для каждого значения в ней есть уникальный индекс.
Слайд 16

Структуры данных Python 07.12.2020 DataFrame — двухмерная структура, состоящая из колонок

Структуры данных Python

07.12.2020

DataFrame — двухмерная структура, состоящая из колонок и строк.

У колонок есть имена, а у строк — индексы.
Слайд 17

Загрузка файла .csv в pandas DataFrame Для загрузки .csv файла с

Загрузка файла .csv в pandas DataFrame

Для загрузки .csv файла с данными

в pandas используется функция read_csv().
Начнем с простого образца под названием zoo. В этот раз для практики предстоит создать файл .csv. Вот сырые данные:
animal,uniq_id,water_need
elephant,1001,500
elephant,1002,600
elephant,1003,550
tiger,1004,300
tiger,1005,320

07.12.2020

Слайд 18

Загрузка файла .csv в pandas DataFrame 07.12.2020 Вернемся во вкладку “Home”

Загрузка файла .csv в pandas DataFrame

07.12.2020

Вернемся во вкладку “Home” https://you_ip:you_port/tree Jupyter

для создания нового текстового файла…
Слайд 19

Загрузка файла .csv в pandas DataFrame 07.12.2020

Загрузка файла .csv в pandas DataFrame

07.12.2020

Слайд 20

Загрузка файла .csv в pandas DataFrame 07.12.2020 Вернемся в Jupyter Notebook

Загрузка файла .csv в pandas DataFrame

07.12.2020

Вернемся в Jupyter Notebook (который называется

«pandas_tutorial_1») и откроем в нем этот .csv файл!

pd.read_csv('zoo.csv', delimiter=',')

Это файл zoo.csv, перенесенный в pandas. Это двухмерная таблица — DataFrame. Числа слева — это индексы. А названия колонок вверху взяты из первой строки файла zoo.csv.