Автоматизированная информационно-аналитическая платформа мониторинга сообщений СМИ, социальных сетей и блогосферы
Содержание
- 2. Поисковая платформа ИАС «АРИОН»
- 3. Internet Archive – более 150 млрд. страниц за период c 1996 года по настоящий момент, включая
- 4. АРИОН: Схема обработки Поиск и отбор
- 5. Извлечение данных из разнородных источников
- 6. АРИОН: Разбор и очистка Определение форматов файлов (doc, pdf, htm и т.д.) Выделение информационной составляющей Атрибуты
- 7. Заголовок Текст Графическое изображение Автор Время Источник АРИОН: Структурный и лингвистический анализ
- 8. АРИОН: Определение набора языков, использованных в документе Дополнение атрибутов документа языковыми характеристиками Полнотекстовое индексирование с учетом
- 9. АРИОН: Формирование и хранение унифицированных представлений .DOC .PDF .MHT .HTML .TXT etc .XLS .PPT etc
- 10. Распределенная обработка входных потоков и организация распределенного доступа к данным
- 11. АРИОН: Полнотекстовый поиск Разные виды поиска – упрощённый и расширенный Морфологический анализ запроса Подсказка при формировании
- 12. Нельзя искать по контексту (известным объектам, фактам, тематикам и т.п.), только по ключевым словам Можно осуществлять
- 13. Семантический поиск информации – на основе семантического описания Преимущества Поиск по контексту (объектам, фактам, темам, сюжетам
- 14. Результат смыслового поиска можно получить только на специализированных ресурсах Поиск билетов Поиск ресторанов/отелей Поиск сведений о
- 15. Примеры семантического поиска
- 16. среднее качество семантического описания низкая трудоемкость создания описания Предоставление семантического описания поставщиками контента высокое качество семантического
- 17. АРИОН: Извлечение семантического описания из источников данных БД Файлы Интернет Обработка
- 18. Пример: откуда можно извлекать семантическое описание? 3,64 миллиона понятий всего 416 тыс. персон 526 тыс. географических
- 19. DBpedia: все французские ученые, которые родились в 19 веке
- 20. АРИОН: Автоматическое формирование семантического описания Многозначная тематическая классификация текстов - отнесение документов к набору заранее заданных
- 21. Многозначная тематическая классификация текстов
- 22. Формирование семантического описания при помощи структурного анализа текстов Выступая Предложил внести изменения
- 23. АРИОН: Работа с результатами поиска Семантическая навигация Выявление статистических закономерностей Формирование типовых отчетов
- 24. Семантическая навигация Объект интереса Переход к статье, содержащей объект интереса Навигация по релевантным документам и часто
- 25. Выявление статистических закономерностей
- 27. Скачать презентацию