Перспективы использования машинного обучения для ИТ-проектов и стартапов

Содержание

Слайд 2

LIFE.FILM это Сервис с Искусственным Интеллектом для создания фильм из лучших

LIFE.FILM это
Сервис с Искусственным Интеллектом
для создания фильм из лучших моментов

вашего видео
Music + Video + Effects.
Слайд 3

Более 10 лет опыта в IT, веб разработке. Основатель веб-студия “3DSTR”,

Более 10 лет опыта в IT, веб разработке.
Основатель веб-студия “3DSTR”,

создавшей более 100 сайтов для города Стерлитамак
Режиссер и ученик киношколы Булата Юсупова (Уфа).
Опыт съёмки видео, видеомонтажа и цветокррекции более 10 лет
Videographer, Videoeditor, Film Director
Designer: Logo, graphic design, printing
3D Architectural visualization: 3DSMax, Blender, Vray
Full Stack developer: PHP, MYSQL/MONGO,Meteor JS, React JS, Linux/AWS, SEO
Data Scientist: Python, Caffe

Александр Сысоенко
Business Devolopment / Основатель
Представитель РОСПАТЕНТ

Тимур Кудашев
Mathematics
Data Scientist (python, c++)
Kazan Federal University

Vadim Balashov
Investment Advisor at GVA LaunchGurus Fund

Damir Kazykhanov
Founder, CEO at Global Startup

CEO Рустам Салаватов (33+)
СФ БашГУ (Информатика)

Advisors

Слайд 4

Все снимает много часов видео, но никто не знает что с

Все снимает много часов видео, но никто не знает что с

ним делать позже.
Отсутствие навыков видеомонтажа и нехватка времени
Неотредактированный видеоматериал обычно удаляются через некоторое время.
Более 100 миллиардов видео-роликов создаются каждый год.
На YouTube загружается только 1% всего объёма созданного мобильного видео.

Видео с детьми
Родители

Путешественники
экстрим/ активный отдых / GoPro

ВидеоБлоггеры
Делать быстрые
репортажи для блога

Слайд 5

Автоматический редактор с искусственным интеллектом Люди легко и просто без опыта

Автоматический редактор с искусственным интеллектом
Люди легко и просто без опыта монтажа

получат фильм профессионального качества.
Музыка + Видео + эффекты.
Музыкальный ритм как основа для редактирования, чтобы создать историю.
Слайд 6

Процесс использования Загружаете/Снимаете Видео Выбираете Музыку Выбираете Фильтр Загружаете Готово через 1-10 Min

Процесс использования

Загружаете/Снимаете Видео

Выбираете Музыку

Выбираете
Фильтр

Загружаете

Готово
через 1-10 Min

Слайд 7

Статус: Пользователей (Russia, Web Beta): MAU: 20000 DAU: 700 Регистраций: 350.000

Статус:

Пользователей (Russia, Web Beta):
MAU: 20000
DAU: 700
Регистраций: 350.000
Traffic: Google/Yandex 1st

postion “Видеоредактор Онлайн” - 2000 lids/day
Слайд 8

Примеры видео:

Примеры видео:

Слайд 9

Roadmap 1 year 2016 Launch iPhone app 2017 2018 Launch Android

Roadmap 1 year

2016

Launch
iPhone app

2017

2018

Launch
Android app

Launch
new WEB app
(MeteorJS +

ReactJS)

Integrate
Socail app
in VK, Facebook

NEW
Neural Algorith
Fast, Learning
by User
Scaling and Growth

Слайд 10

Набережные Челны (IT-Park) 150 рабочих мест для 50 ИТ-стартапов

Набережные Челны (IT-Park)

150 рабочих мест для 50 ИТ-стартапов

Слайд 11

Слайд 12

Слайд 13

Слайд 14

Слайд 15

Испания (Malaga Valley)

Испания (Malaga Valley)

Слайд 16

Слайд 17

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ ARTIFICIAL INTELLIGENCE

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

ARTIFICIAL INTELLIGENCE

Слайд 18

Когда SkyNet? В течении 10-20 лет - НЕТ при текущем стеке

Когда SkyNet?

В течении 10-20 лет - НЕТ при текущем стеке технологий.


Стивен Хокинг: искусственный разум станет лучшим или худшим изобретением человечества

Слайд 19

Интерес в мире к ИИ

Интерес в мире к ИИ

Слайд 20

Цифровая вселенная Данные следуют цифровому закону Мура: данные увеличиваются каждый год

Цифровая вселенная

Данные следуют цифровому закону Мура: данные увеличиваются каждый год в

2 раза а цена их хранения падает.
Данные короли в этой вселенной. Чем больше данных тем более совершенные модели машинного обучения.
Например, Тесла собрал 780 миллионов миль данных о вождении , и они добавляют еще один миллион каждые 10 часов.
Каждая компания является компанией данных.
Слайд 21

Ренесанс нейронных сетей Нейронные сети требует много вычеслений и много данных.

Ренесанс нейронных сетей

Нейронные сети требует много вычеслений и много данных. В

последнии 5 лет это перестало быть проблемой.
В частности видеокарты с мощными GPU и интернет стали основой для ренесанса.
Слайд 22

Deep Learning? Knowledge bases – знания формируются вручную Machine learning –

Deep Learning?

Knowledge bases – знания формируются вручную
Machine learning – знания

формируются автоматически из данных, но представление данных делается вручную
Representation learning – представление данных делается автоматически
Deep learning – знания формируются автоматически из автоматически формируемых представлений данных
Слайд 23

Слайд 24

Слайд 25

Последствия По оценкам различных экспертов в ближайшие 10-20 лет 80-90% существующих

Последствия

По оценкам различных экспертов в ближайшие 10-20 лет 80-90% существующих работ

будут выполняться роботами/программами.
Высокий риск роботизации (80-100%) у следующих специальностей: экскурсоводы, таксисты, пекари, мясники, модели, фармацевты, страховые агенты, продавцы, сборщики налогов и чиновники.
Слайд 26

Хайп вокруг DL

Хайп вокруг DL

Слайд 27

Data Scientist - лучшая работа на свете (Ученого по данным) Средняя

Data Scientist - лучшая работа на свете
(Ученого по данным)

Средняя зарплата

DS в США: 100-150 тыс $ (программиста 60,000 $)
В россии: 100-300 тыс руб. (Москва)
Математика+Программирование+Интуиция
Python как основной инструмент
Слайд 28

Нейронные сети

Нейронные сети

Слайд 29

Активность нейрона определяется преобразованием взвешенного суммарного воздействия на него Воздействия могут

Активность нейрона определяется преобразованием взвешенного суммарного воздействия на него
Воздействия могут

быть активирующими (положительные веса) или тормозными (отрицательные веса)

Нейрон

Слайд 30

Слайд 31

Глубокие нейронные сети

Глубокие нейронные сети

Слайд 32

Слайд 33

2012 - AlexNet (Supervision) В 2012 выигрывает AlexNet с большим отрывом

2012 - AlexNet (Supervision)

В 2012 выигрывает AlexNet с большим отрывом от

конкурентов благодаря использованию сверточной нейронной сети.
Ренесанс нейронных сетей.
Слайд 34

Сверточные нейронные сети (CNN) Сеть находит “свертки”, которые максимизируют информацию об

Сверточные нейронные сети (CNN)

Сеть находит “свертки”, которые максимизируют информацию об изображении

(картинки: 3*3, 5*5, 20*20.)
На первом уровне сеть извлекает самые базовые: границы, штрихи, отрезки, контрасты. Повыше — уже устойчивые комбинации элементов первого уровня, и так далее вверх по цепочке.
Cети сами формируют эти элементы и решают, какие из них более важный, а какие — нет.
Слайд 35

Слайд 36

Слайд 37

Слайд 38

2012 Alexnet 2014 GoogleNet

2012 Alexnet

2014 GoogleNet

Слайд 39

2015 - 152 слоя в ResNet ResNet - Огромное число слоев

2015 - 152 слоя в ResNet

ResNet - Огромное число слоев и

оптимизация структуры сети дало процент ошибки, меньше чем у человека
Теперь нейросети решают проблемы и задачи, которые ещё пять лет назад требовали огромного количество сил и были результатом работы целых групп учёных.
Слайд 40

http://www.asimovinstitute.org/neural-network-zoo/

http://www.asimovinstitute.org/neural-network-zoo/

Слайд 41

Игры разума: AlphaGo

Игры разума:
AlphaGo

Слайд 42

Слайд 43

Слайд 44

DeepMind: Atari В начале 2015 года журнал Nature выходит с обложкой

DeepMind: Atari

В начале 2015 года журнал Nature выходит с обложкой по

глубокому обучению. В номере опубликована статья в которой показано, что глубокое обучение с подкреплением позволяет обучиться играть в компьютерные игры не зная правил заранее лучше человека.
Google покупает за $600М стартап авторов статьи Deep Mind.
Данный результат открывает качественно новые области для применения глубокого обучения в задачах управления, искусственного интеллекта и робототехники.
Слайд 45

Опенсорс версия https://github.com/Rochester-NRT/RocAlphaGo

Опенсорс версия https://github.com/Rochester-NRT/RocAlphaGo

Слайд 46

Варианты применения GitXiv.com

Варианты применения
GitXiv.com

Слайд 47

Компания Google выложила в открытый доступ код своей нейросети «Show and

Компания Google выложила в открытый доступ код своей нейросети «Show and

Tell» для TensorFlow, которая может делать осмысленные подписи к изображениям.
Слева – описанные людьми изображения, которые показывали нейросети для ее обучения.
Справа – результат работы уже самой нейросети
Точность алгоритма, по данным Google, составляет 93,9%.

Show and Tell

Слайд 48

NeuralTalk Efficient Image Captioning code in Torch https://github.com/karpathy/neuraltalk2

NeuralTalk

Efficient Image Captioning code in Torch
https://github.com/karpathy/neuraltalk2

Слайд 49

Neural Style

Neural Style

Слайд 50

SegNet Сеть делает разметку видео с видеорегистратора по типу объекта: «дорога»,

SegNet

Сеть делает разметку видео с видеорегистратора по типу объекта: «дорога», «пешеходы»,

«знаки», «разметка», и.т.д
Всего несколько обученных слоёв, настраивается за пару дней
Прямое преобразование данных в ответ. Кадры обрабатываются быстро.
Слайд 51

“Супер увеличение” Нейронные сети способны как в фильмах про шпионов, увеличивать

“Супер увеличение”

Нейронные сети способны как в фильмах про шпионов, увеличивать участки

на фото с пикселями и улучшать результат.
https://github.com/david-gpu/srez
Слайд 52

Texture Networks Синтез текстур и стилизованных изображений в художественном стиле. Более

Texture Networks

Синтез текстур и стилизованных изображений в художественном стиле.
Более быстрый

аналог Artistic Style. Используется в приложении Prisma и Vinci
https://github.com/DmitryUlyanov/texture_nets
Слайд 53

seq2seq : Deep Q&A Чатбот на RNN (seq2seq model) обученный на

seq2seq : Deep Q&A

Чатбот на RNN (seq2seq model) обученный на диалогах

из фильмов (Cornell Movie-Dialogs Corpus)
https://github.com/Conchylicultor/DeepQA
Слайд 54

WaveNet: новая модель для генерации человеческой речи и музыки https://deepmind.com/blog/wavenet-generative-model-raw-audio/

WaveNet: новая модель для генерации человеческой речи и музыки

https://deepmind.com/blog/wavenet-generative-model-raw-audio/

Слайд 55

VizDoom Искусственный интеллект научили играть в Doom. Для обучения бота IntelAct нужен один обычный компьютер.

VizDoom

Искусственный интеллект научили играть в Doom.
Для обучения бота IntelAct нужен

один обычный компьютер.
Слайд 56

Где научиться и заработать

Где научиться и заработать

Слайд 57

Слайд 58

Сложно ли это? Начать сложно. Глубокое обучение сейчас обилует научными терминами

Сложно ли это?

Начать сложно. Глубокое обучение сейчас обилует научными терминами для

ученых. Если вы практик или разработчик вы хотите разультата сразу!
Вы думаете обязательно нужно потратить 5 лет своей жизни чтобы начать? Нет!
Вы можеет начать получать результат сразу изучая тему снизу вверх, подкрепляя по ходу теорией. Эти знания придут с опытом.
Слайд 59

Фрейморки: Keras, TensorFlow (Google) Я рекомендую платформу Keras . Он поддерживает

Фрейморки: Keras,
TensorFlow (Google)

Я рекомендую платформу Keras . Он поддерживает Python.


Вы также можете использовать scikit и всю SciPy экосистему для учебных проектов.
Он работает поверх других библиотек и упрощает работу с ними (Theano и TensorFlow)
Слайд 60

Слайд 61

AETROS Оболочка для онлайн проектирования и обучения нейронных сетей на базе фреймворка Keras

AETROS

Оболочка для онлайн проектирования и обучения нейронных сетей на базе фреймворка

Keras
Слайд 62

Jupyter Notebook (iPython) Jupyter — идейный наследник IPython Notebook. Jupyter -

Jupyter Notebook
(iPython)

Jupyter — идейный наследник IPython Notebook.
Jupyter - интерактивная оболочка

для языка программирования Python.
https://www.continuum.io/downloads
Слайд 63

Онлайн образование Можно учиться не выходя из дома, быстро и эффективно https://www.coursera.org/specializations/machine-learning-data-analysis

Онлайн
образование

Можно учиться не выходя из дома, быстро и эффективно
https://www.coursera.org/specializations/machine-learning-data-analysis

Слайд 64

№1 площадка для специалистов ML. Данные - как спорт, много соревнований.

№1 площадка для специалистов ML.
Данные - как спорт, много соревнований.
Сообщесто,

код, датасеты, вакансии
Если вы в ТОП - куча предложений о работе и денег.
Детектирование диабетической ретинопатии (100k$)
Классификация морского планктона (175k$)
Классификация галактик
Поиск темной материи (NASA and the Royal Astronomical Society)

Выпускник НИУ ВШЭ Станислав Семенов занял первое место в мировом рейтинге

Слайд 65

Слайд 66

Хакатон http://www.chatbotscommunity.com/chatbots-hackatons-cup-2016/ Вам нужна практика. Много практики.

Хакатон

http://www.chatbotscommunity.com/chatbots-hackatons-cup-2016/
Вам нужна практика. Много практики.

Слайд 67

Что нужно чтобы найти работу: Английский язык Пройти курсы на Coursera

Что нужно чтобы найти работу:

Английский язык
Пройти курсы на Coursera и

получить сертификаты
Вникнуть в тему DL, прочитать все важные статьи и работы за последнии годы (arxiv.org, gitxiv.com)
Поучаствовать на конкурсах в Kaggle
Выбрать направление в Deep Learning
Освоить язык программирования python или R, базы данных (mysql, mongodb)
Математическая база: дискретная математика, статистика, теория вероятностей, комбинаторика, графы, линейная алгебра
Прокаченный профиль linkedin, github
Слайд 68

Что посмотреть: ВК группы: https://vk.com/deeplearning_ru - Моя https://vk.com/deeplearning - основная Подборки

Что посмотреть:

ВК группы:
https://vk.com/deeplearning_ru - Моя
https://vk.com/deeplearning - основная
Подборки различных материалов:
https://github.com/demidovakatya/vvedenie-mashinnoe-obuchenie
HabrHabr:
Из физиков

в Data Science - https://habrahabr.ru/post/310776/ (его резюме)

Мероприятие -
https://vk.com/bashgu_ii
Группа -
https://vk.com/digital_str

Слайд 69

Клуб Data Science БашГУ: Создание клуба заинтересованных лиц для совместного изучения

Клуб Data Science БашГУ:

Создание клуба заинтересованных лиц для совместного изучения и

обсуждения ИИ.
Участие в конкурсах KAGGLE
Изучение Python
Создание приложений
Обмен опытом
Проведение конференций
Разработка собственных проектов - стартапов
Кто? Любой из вас и ваших друзей может вступить в клуб.
Слайд 70

Рустам Салаватов +7 (962) 52-38-149 info@life2film.com skype: rust.salavatov www.life2film.com vk.com/life2film

Рустам Салаватов
+7 (962) 52-38-149
info@life2film.com
skype: rust.salavatov
www.life2film.com vk.com/life2film

Слайд 71

Материалы для презентации https://habrahabr.ru/company/yandex/blog/307260/ http://media.wix.com/ugd/d1d481_506c12d3c10d4ce5a6112bcb41e1d750.pdf http://www.slideshare.net/chatbotscommunity/20-muzis-hackathon?qid=9d377b11-150b-423c-81ba-7bd153f43b72&v=&b=&from_search=1 https://www.youtube.com/watch?v=bicXInoeLG4 https://www.youtube.com/watch?v=YbZlz_2MXC8

Материалы для презентации

https://habrahabr.ru/company/yandex/blog/307260/
http://media.wix.com/ugd/d1d481_506c12d3c10d4ce5a6112bcb41e1d750.pdf
http://www.slideshare.net/chatbotscommunity/20-muzis-hackathon?qid=9d377b11-150b-423c-81ba-7bd153f43b72&v=&b=&from_search=1
https://www.youtube.com/watch?v=bicXInoeLG4
https://www.youtube.com/watch?v=YbZlz_2MXC8

Слайд 72

Слайд 73

Официальное образование

Официальное образование

Слайд 74

Образовательная траектория абитуриента/студента

Образовательная траектория абитуриента/студента

Слайд 75

Образовательная траектория профессионала - исследователя

Образовательная траектория профессионала - исследователя