Содержание
- 2. Методы расширения запроса Несовпадение слова запроса: самолет – лайнер Методы расширения запроса: Глобальные методы Ручной тезаурус
- 3. Обратная связь по релевантности Пользователь оценивает документы в поисковой выдаче Пользователь задает относительно простой, короткий запрос
- 4. Результаты для начального запроса Sec. 9.1.1
- 5. Разметка пользователя Sec. 9.1.1
- 6. Результаты после разметки Sec. 9.1.1
- 7. Выдача по запросу canine source: Fernando Diaz
- 8. Выдача по запросу canine-2 source: Fernando Diaz
- 9. Пользователь выбирает релевантное source: Fernando Diaz
- 10. Результаты (relevance feedback) source: Fernando Diaz
- 11. Начальный запрос и результаты Запрос: New space satellite applications 1. 0.539, 08/13/91, NASA Hasn’t Scrapped Imaging
- 12. Расширенные запрос после relevance feedback 2.074 new 15.106 space 30.816 satellite 5.660 application 5.991 nasa 5.196
- 13. Ключевое понятие: центроид Центроид – это центр масс совокупности точек Документы – это точки в многомерном
- 14. Алгоритм Роккьо (Rocchio) Алгоритм Rocchio использует векторное пространства найти наилучший запрос на основе пользовательской разметки Rocchio
- 15. Лучший запрос x x x x o o o Оптимальн. запрос x нерелевант. документы o релевантные
- 16. Rocchio 1971 алгоритм (SMART) На практике используется: Dr = множество известных релевантных doc векторов Dnr =
- 17. Особенности параметров Соотношение α vs. β/γ : Если у нас много оцененных документов, то лучше более
- 18. Relevance feedback по исходному запросу x x x x o o o Модиф. запрос x Известные
- 19. Relevance Feedback в векторных пространствах Можно модифицировать запрос на основе разметки пользователя и применить стандартную векторную
- 20. Позитивный vs Негативный Feedback Позитивный feedback более ценен, чем негативный feedback (обычно γ Многие системы позволяют
- 21. Relevance Feedback: предположения A1: Пользователь имеет достаточно знаний для исходного запроса A2: Прототипы релевантных/нерелевантных документов “ведут
- 22. Нарушение A1 У пользователя нет достаточного начального знания Примеры: Неправильное написание: Brittany Speers. Многоязыковой информационный поиск
- 23. Нарушение A2 Имеется несколько прототипов Примеры: Сейчас: Украина – две точки зрения Pop stars that worked
- 24. Relevance Feedback: Проблемы Длинные запросы – неэффективны для типичной поисковой машины Большее ожидание для пользователя Высокая
- 25. Relevance Feedback в вебе Некоторые поисковые машины предлагают возможность просмотра похожих страниц Тривиальная форма relevance feedback
- 26. Pseudo relevance feedback Pseudo-relevance feedback автоматизирует «ручнею» часть реального relevance feedback. Pseudo-relevance алгоритм: Строит поисковую выдачу
- 27. Методы расширения запроса Несовпадение слова запроса: самолет – лайнер Методы расширения запроса: Глобальные методы Ручной тезаурус
- 28. Расширение запроса, основанное на тезаурусных знаниях Для каждого термина t в запросе происходит расширение синонимичными словами
- 29. Расширение запроса, основанное на тезаурусных знаниях-2 Увеличивает полноту поиска Обычно снижает точность поиска, обычно для многозначных
- 30. Тезаурусные отношения при автоматич. расширении запросов Синонимы хорошо работает для однозначных слов (выражений) Родовидовые отношения (выше-ниже)
- 31. Тезаурусные отношения при автоматич. расширении запросов-2 Традиционные информационно-поисковые тезаурусы Отношение ассоциации Считается симметричным, но фактически часто
- 32. Методы расширения запроса Несовпадение слова запроса: самолет – лайнер Методы расширения запроса: Глобальные методы Информационно-поисковый тезаурус
- 33. Слайды доклада Расширение поисковых запросов А. Сокирко Е. Соловьев (Яндекс) http://romip.ru/russir2010/slides/yandex_lecture.pdf
- 34. Типы синонимов для расширения запроса С соответствиями между внутренними элементами: Словообразование: Москва – московский; компиляция -
- 36. Алгоритм составления базы Получение списка гипотез Машинное обучение Отсечение результатов – отсекается первый миллион и объявляется
- 37. Извлечение синонимов для автоматического расширения запросов Компания Яндекс: доклад Russir-2010 Признаки для извлечения синонимов Совместная встречаемость
- 38. Признаки синонимов: Скобочное написание Скобочное написание – это набор n-gram, которые встречаются с текстах рунета в
- 39. Признаки синонимов: Открытые словари Русская Википедия содержит около миллиона жестких перенаправлений, типа: Абрикос сибирский --- Даурсат
- 40. Оценка качества 1) Оценка пары синонимов без контекста 2) Оценка пары синонимов в контексте запроса 3)
- 43. Лексические расширения с использованием автоматического тезауруса Те же проблемы, что и в ручном: Многозначность запроса или
- 44. Примеры расширения (декабрь 2010 – февраль 2011) Запрос – документ речное судно – морское судно речной
- 45. 2011 год
- 46. 2011г.
- 48. 2015 год
- 49. Заключение: методы расширения запроса Глобальные методы Ручные тезаурусы Автоматически порождаемый тезаурус Локальные методы (по конкретному запросу)
- 51. Скачать презентацию