Содержание
- 2. Поиск по базам? Базы постоянно растут 1M записей “есть у всех” 10-100M записей не редкость Существуют
- 3. Виды специальных задач “Просто” поиск – ключевая задача, но… В чистом виде бывает на удивление редко
- 4. Встроенный MySQL FTS Плюс – встроен, обновляется “сразу” Минус – Только MyISAM Минус – плохо масштабируется
- 5. Shootout внешних решений Тестировались известные (нам) open-source решения Коммерческие решения пусть рекламируют сами производители ☺ MySQL
- 6. ~3.5M записей, ~5 GB текста (из Wikipedia) mnoGoSearch сошел с дистанции подробнее в презентации Петра Зайцева
- 7. Имеющиеся решения mnoGoSearch Минус – проблемы со скоростью индексации и поиска FATAL – 5 GB за
- 8. Sphinx – обзор Внешнее решение для поиска по СУБД Две основные программы Indexer, для переиндексации FT
- 9. Sphinx – идеология Индексация локально доступных баз данных Изначальная поддержка структурированных “как в SQL” документов До
- 10. Sphinx – поиск Качество Учитываются позиции слов, не только их частоты Масштабируемость До 50-100 GB текста
- 11. Sphinx – спецвозможности Сортировка По любой комбинации атрибутов, SQL синтаксис Фильтрация записей по условию Учитывается при
- 12. Sphinx – спецвозможности Группировка Возможна по какому-либо атрибуту Выполняется в фиксированной памяти Выполняется неточно (!) Выполняется
- 14. Скачать презентацию