Big Data. Эксгумация больших данных

Слайд 2

Что такое большие данные? 24TB 24TB

Что такое большие данные?

24TB

24TB

Слайд 3

Что такое большие данные? 36TB 48TB

Что такое большие данные?

36TB

48TB

Слайд 4

Что такое большие данные?

Что такое большие данные?

Слайд 5

Это когда проще отправить код к данным

Это когда проще отправить код к данным

Слайд 6

Это когда проще отправить код к данным

Это когда проще отправить код к данным

Слайд 7

Это когда проще отправить код к данным

Это когда проще отправить код к данным

Слайд 8

Это когда проще отправить код к данным

Это когда проще отправить код к данным

Слайд 9

Слайд 10

Экосистема Hadoop

Экосистема Hadoop

Слайд 11

Big Data — зоопарк: слоны, свиньи и т.д. Hadoop — экосистема,

Big Data — зоопарк: слоны, свиньи и т.д.

Hadoop — экосистема, набор

библиотек и утилит для работы с большими распределенными данными
HDFS — файловая система для блочного хранения больших файлов с поддержкой репликации
YARN — утилита для планирования, координации и управления вычислительными ресурсами кластера
Spark — фреймворк для распределенной обработки неструктурированных и слабоструктурированных данных
Слайд 12

HDFS

HDFS

Слайд 13

YARN

YARN

Слайд 14

YARN

YARN

Слайд 15

MapReduce

MapReduce

Слайд 16

MapReduce

MapReduce

Слайд 17

Spark

Spark

Слайд 18

Spark

Spark

Слайд 19

Spark

Spark