Содержание
- 2. Одноклассники в цифрах Что у нас есть: 100 млн пользователей; 3.3 млн групп; ..... 4.1 млн
- 3. Зачем нам понадобились свои поисковые системы? Пользователь не всегда знает, как именно регистрировался искомый друг На
- 4. Почему Lucene? Поиск по MS SQL базе был крайне медленным На Java написано 99% нашего кода,
- 5. Как устроен Lucene? The bright blue butterfly hangs on the breeze It’s best to forget the
- 6. Требования к системе индексов Отказоустойчивость и масштабируемость Высокая производительность поисковых серверов Гибкое индексирование Возможность сбора дополнительной
- 7. Что нас не устроило в Solr Solr: сервер использует только один процессор репликация индексов на bash-скриптах
- 8. Архитектура Presentation Search processing system Event Indexer + DB Query Result Result Read Read Update/Notify Index
- 9. Требования к поисковой системе Отказоустойчивость Использование социального графа Эффективность Простое изменение и расширение функциональности Сбор статистики
- 10. Как работает поисковая система Get session for Schema Execute queries Reduce results Schedule queries Load results
- 11. Проблемы: работа с индексом Lucene активно читает файлы во время поиска Пробовали: Диск с FSDirectory и
- 12. Проблемы: ThreadLocal кэши Долгий GC из-за уймы мелких объектов в хипе Причины: Lucene использует ThreadLocal кэши
- 13. Проблемы: медленные хранимые поля Медленная работа с хранимыми полями Причина: При считывании хранимого поля создается много
- 14. Распознавание полей Поиск пользователей идет по следующим полям: имя и фамилия, город, страна, интервал возростов Друга
- 15. Поиск по возрасту Стандартные решения: Добавление всех подходящих терминов Префиксные термины для снижения количества терминов в
- 16. Поиск музыки В базе есть: артисты; альбомы; композиции не сортированые музыкальные композиции Три точности совпадения: точное;
- 17. Индексация музыки Все храним в одном индексе У каждого документа: в id зашит его тип (артист;
- 18. Поиск музыки Пробовали: Отдельный запросы для каждого типа Повторные запросы с меньшей точностью Настройка оценщика веса
- 19. Поисковые сервера 8 серверов 7 000 МБ 20 мс 1100 з/c 2 сервера 600 МБ 3
- 21. Скачать презентацию