Neural Networks for Information Retrieval

Содержание

Слайд 2

Word embeddings and convolution neural networks for NLP

Word embeddings and convolution neural networks for NLP

Слайд 3

Semantic Level NLP Поиск синонимов Ответы на вопросы Чат боты Машинный перевод Построение аннотаций ….

Semantic Level NLP

Поиск синонимов
Ответы на вопросы
Чат боты
Машинный перевод
Построение аннотаций
….

Слайд 4

xмальчик: [0 0 0 0 1 0 0 0 0 ]

xмальчик: [0 0 0 0 1 0 0 0 0 ]
xпарень:

[0 0 0 0 0 0 1 0 0 ]
xолень: [0 1 0 0 0 0 0 0 0 ]

Классический подход:
Перенумеровываем слова (“один”,”два”)
Используем one-hot encoding

Проблема:

||xмальчик - xпарень|| = ||xпарень - xолень||

Решение: компактные представления

Word-based NLP

Слайд 5

Проблема: Очень высокая размерность пространства Костыль 1: Лемматизация (“Парни -> парень”,

Проблема: Очень высокая размерность пространства
Костыль 1: Лемматизация (“Парни -> парень”, “Шёл”

->”Идти”)
Side-effect 1: Лемматизация приводит к потере информации
Костыль 2: Заменить редкие слова заглушкой
Side-effect 2: Во многих задачах редкие слова крайне информативны

Word-based NLP

xмальчик: [0 0 0 0 1 0 0 0 0 ]
xпарень: [0 0 0 0 0 0 1 0 0 ]
xолень: [0 1 0 0 0 0 0 0 0 ]

Слайд 6

Лингвистические единицы, встречающиеся в схожих контекстах, имееют близкие значения. Дистрибутивная гипотеза

Лингвистические единицы, встречающиеся в схожих контекстах, имееют близкие значения.

Дистрибутивная гипотеза

Гипотеза:

Значит, представления

слов, можно построить с помощью контекстов, в которых эти слова употребляются.

Вывод:

Слайд 7

Word2Vec (2013) Архитектуры CBOW и Skip-gram

Word2Vec (2013)

Архитектуры CBOW и Skip-gram

Слайд 8

CBOW (Continious Bag of Words)

CBOW (Continious Bag of Words)

Слайд 9

Skip-gram

Skip-gram

Слайд 10

Skip-gram Оптимизируем

Skip-gram

Оптимизируем

Слайд 11

Skip-gram Вычисление вероятностей выходных слов

Skip-gram

Вычисление вероятностей выходных слов

Слайд 12

Negative sampling Идея:

Negative sampling

Идея:

Слайд 13

Свойства выученных представлений vec(“man”) - vec(“king”) + vec(“woman”) = vec(“queen”)

Свойства выученных представлений

vec(“man”) - vec(“king”) + vec(“woman”) = vec(“queen”)

Слайд 14

Пример модели

Пример модели

Слайд 15

Doc2vec (Mikolov, 2014) Обобщение word2vec на целые документы (фразы, предложения и

Doc2vec (Mikolov, 2014)

Обобщение word2vec на целые документы (фразы, предложения и т.д.)
Преобразует

текст произвольной длины в вектор фиксированного размера
Distributed Memory (DM)
Distributed Bag of Words (DBOW)
Слайд 16

Doc2vec (Mikolov, 2014) Distributed Memory (DM)

Doc2vec (Mikolov, 2014)

Distributed Memory (DM)

Слайд 17

Doc2vec (Mikolov, 2014) Distributed Bag of Words (DBOW)

Doc2vec (Mikolov, 2014)

Distributed Bag of Words (DBOW)

Слайд 18

Character-level ConvNet Trained for text classification

Character-level ConvNet

Trained for text classification

Слайд 19

Векторное представление текста как изображения

Векторное представление текста как изображения

Слайд 20

Convolutional Neural Networks for Sentence Classification Обычная сверточная сеть, проинициализированная word2vec представлениями слов

Convolutional Neural Networks for Sentence Classification

Обычная сверточная сеть, проинициализированная word2vec представлениями

слов
Слайд 21

Neural networks for recommendation systems

Neural networks for recommendation systems

Слайд 22

Рекомендательные системы

Рекомендательные системы

Слайд 23

E-commerce

E-commerce

Слайд 24

Recommender systems - The task Нужно построить модель, предсказывающую насколько user

Recommender systems - The task

Нужно построить модель, предсказывающую насколько user нравятся

items
У типичной рекомендательной системы имеется:
Матрица users и items
Рейтинги, отражающие их прошлые предпочтения
Задача состоит в предсказании будущих предпочтений
В общем случае, все НЕ ограничивается предсказанием рейтинга
Слайд 25

Approaches to recommender systems Collaborative filtering Основан на анализе предпочтений пользователей

Approaches to recommender systems

Collaborative filtering
Основан на анализе предпочтений пользователей таких как

рейтинги фильмов, лайки и т.д.
Content-based filtering
Основан на матчинге представлений items и users
Пользовательский профиль может представляться предыдущими рейтингами, посещенными страницами в интернете, поисковыми запросами и т.д.
A hybrid approach
Слайд 26

Matrix factorization

Matrix factorization

Слайд 27

A feed-forward neural network view

A feed-forward neural network view

Слайд 28

Pytorch example

Pytorch example

Слайд 29

Factorization Machines

Factorization Machines

Слайд 30

Factorization Machines as Neural Network

Factorization Machines as Neural Network

Слайд 31

A deeper view

A deeper view

Слайд 32

Wide and Deep (Google 2016)

Wide and Deep (Google 2016)

Слайд 33

Нейросетевые архитектуры для CF FNN - FM initialized feed forward neural

Нейросетевые архитектуры для CF

FNN - FM initialized feed forward neural network

PNN

- Product based neural network
Слайд 34

DeepFM (2017)

DeepFM (2017)

Слайд 35

DeepFM (2017)

DeepFM (2017)

Слайд 36

Prod2Vec and Item2Vec Prod2vec skip-gram model Prod2Vec & item2vec: факторизация матрицы

Prod2Vec and Item2Vec

Prod2vec skip-gram model

Prod2Vec & item2vec: факторизация матрицы совместной покупки

товаров
Аналог word2vec за исключением игнорирования пространственной составляющей
Слайд 37

Pandao2Vec + _ = Чехол для IPhone Стекло для IPhone Стекло

Pandao2Vec

+

_

=

Чехол
для
IPhone

Стекло
для
IPhone

Стекло
для
Samsung

Чехол
для
Samsung

Вектора Pandao2Vec отражают семантику
Для них даже (иногда)

работают аналогии:
Слайд 38

Pandao2Vec Топ 1000 товаров

Pandao2Vec

Топ 1000 товаров

Слайд 39

Neural networks for information retrieval

Neural networks for information retrieval

Слайд 40

Задача ранжирования в поиске

Задача ранжирования в поиске

Слайд 41

Поиск

Поиск

Слайд 42

Vector space ranking model

Vector space ranking model

Слайд 43

BM25

BM25

Слайд 44

Классические модели

Классические модели

Слайд 45

Векторная модель

Векторная модель

Слайд 46

Векторная модель

Векторная модель

Слайд 47

Векторная модель

Векторная модель

Слайд 48

Latent Semantic Analysis

Latent Semantic Analysis

Слайд 49

Dual Embedding Space Model (DESM)

Dual Embedding Space Model (DESM)

Слайд 50

Dual Embedding Space Model (DESM)

Dual Embedding Space Model (DESM)

Слайд 51

Dual Embedding Space Model (DESM)

Dual Embedding Space Model (DESM)

Слайд 52

Dual Embedding Space Model (DESM)

Dual Embedding Space Model (DESM)

Слайд 53

Lexical and Semantic matching Традиционные модели инфопоиска работают исключительно на лексическом

Lexical and Semantic matching

Традиционные модели инфопоиска работают исключительно на лексическом матчинге
Representation

модели могут учитывать как все термы документа соотносятся с запросом
И те и другие могут быть смоделированы с помощью нейросетей
Слайд 54

Инструмент

Инструмент

Слайд 55

Deep Structured Semantic Model (DSSM) (2013)

Deep Structured Semantic Model (DSSM) (2013)

Слайд 56

Deep Structured Semantic Model (DSSM) (2013) Collisions Learning

Deep Structured Semantic Model (DSSM) (2013)

Collisions

Learning

Слайд 57

DSSM в яндексе

DSSM в яндексе

Слайд 58

DSSM в яндексе Запрос: [келлская книга]

DSSM в яндексе

Запрос: [келлская книга]

Слайд 59

DSSM в яндексе Запрос: [евангелие из келлса]

DSSM в яндексе

Запрос: [евангелие из келлса]

Слайд 60

DSSM в яндексе Запрос: [рассказ в котором раздавили бабочку]

DSSM в яндексе

Запрос: [рассказ в котором раздавили бабочку]

Слайд 61

Interaction matrix based approaches

Interaction matrix based approaches

Слайд 62

MatchPyramid Сверточные слои поверх interaction matrix между запросом и документом После конволюций полносвязные слои

MatchPyramid

Сверточные слои поверх interaction matrix между запросом и документом
После конволюций полносвязные

слои
Слайд 63

MatchPyramid

MatchPyramid

Слайд 64

Duet Model Совместно тренируем 2 подсетки, сфокусированные на лексическом и семантическом матчинге

Duet Model

Совместно тренируем 2 подсетки, сфокусированные на лексическом и семантическом матчинге

Слайд 65

Duet Model

Duet Model

Слайд 66

Duet Model

Duet Model