Основы публикационной активности

Содержание

Слайд 2

Общеизвестные факты Более 90% российских публикаций отсутствуют в зарубежных базах цитирования.

Общеизвестные факты
Более 90% российских публикаций отсутствуют в зарубежных базах цитирования.
Структура российских

публикаций в зарубежных базах кардинально отличается от структуры в РИНЦ.
Граф цитирований российских публикаций слабосвязный, цитируют плохо и мало.
В российских базах много некачественных публикаций.
Российские базы не состыкованы друг с другом.
Слайд 3

Где хранятся научные тексты? РГБ (диссертации и авторефераты) ЦИТИС (отчеты о

Где хранятся научные тексты?
РГБ (диссертации и авторефераты)
ЦИТИС (отчеты о НИОКР)
Дирекция ФЦП

(заявки отчеты по ФЦП)
РФФИ, РНФ и другие фонды (заявки и отчеты о НИОКР)
ФИПС (база патентов)
eLibrary, Киберленинка, MathNet (российские публикации)
РУКОНТ, ИНФРА-М и др. (массивы научной литературы)
ЭБС ВУЗов (ВКР, ВУЗовский контент)
Слайд 4

В чем проблема и как ее решать? Проблема: Слабая интеграция российской

В чем проблема и как ее решать?

Проблема:
Слабая интеграция российской науки в

мировую, разрозненность баз, отсутствие современных отечественных инструментов не позволяют решить ряд важных задач: картирование науки, оценка коллективов исследователей, оценка научных журналов и др.
Что делать:
Интегрировать информацию из различных источников.
Комбинировать анализ полных текстов и наукометрию.
Не бояться придумывать что-то новое, чего нет в Scopus или WoS ☺
Слайд 5

Что такое анализ полных текстов научных публикаций? Выделение текста. Лингвистический анализ

Что такое анализ полных текстов научных публикаций?

Выделение текста.
Лингвистический анализ (морфология, синтаксис,

семантика).
Извлечение информации (название, авторы, аннотация, ключевые слова и тд.)
Индексация в базе данных поисково-аналитической машины.
Слайд 6

Базовые алгоритмы для работы с полными текстами Семантический поиск. Поиск тематически

Базовые алгоритмы для работы с полными текстами
Семантический поиск.
Поиск тематически похожих документов.
Автоматическое

выявление ключевых слов.
Автоматическая классификация.
Кластеризация.
Тематический анализ.
Семантический поиск текстовых заимствований.
Извлечение информации из текстов.
Анализ тональности высказываний.
Слайд 7

Пример 1: выявление научных коллективов и анализ их активности

Пример 1: выявление научных коллективов и анализ их активности

Слайд 8

Что такое научный коллектив? Научный коллектив – группа исследователей, ведущих совместную

Что такое научный коллектив?

Научный коллектив – группа исследователей, ведущих совместную научную

деятельность в одной или нескольких близких предметных областях и имеющих совместные публикации в открытой научной печати за определенный период времени.
Слайд 9

Анализ цитирований: Cytoscape igraph NetMiner … №1 Как решается проблема на

Анализ цитирований:
Cytoscape
igraph
NetMiner

№1

Как решается проблема
на западе

Западные инструменты:
Не позволяют разделять тесно взаимодействующие

коллективы.
Не используют информацию о цитированиях. Не используют полные тексты для определения предметной области коллектива.
Не выделяют роли в коллективах (лидеры, основной состав, приглашенные авторы и др.)
С использованием западных инструментов задача выявления российских коллективов исследователей не может быть решена!

№2

Слайд 10

Формирование графа 1. Реляционно-ситуационный метод поиска и анализа текстов и его

Формирование графа

1. Реляционно-ситуационный метод поиска и анализа текстов и его приложения
Авторы:

Г.С. Осипов, И.В. Смирнов, И.А. Тихомиров. Год публикации:2008.  

2. СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОГО ПОИСКА ЭЛЕКТРОННЫХ ДОКУМЕНТОВ
Авторы: Осипов Геннадий Семенович (RU), Тихомиров Илья Александрович (RU), Соченков Илья Владимирович (RU), Смирнов Иван Валентинович (RU). Год публикации:2013.

3. Увеличение разрешения полнопольного оптического когерентного томографа при использовании цветного датчика изображения
Авторы: А. Л. Кальянов a , В. В. Лычагов a , И. В. Смирнов a , В. П. Рябухо ab. Год публикации:2013.

Приведение имени автора к единому виду:
1. Смирнов И.В.
2. Смирнов Иван Валентинович => Смирнов И.В.
3. Смирнов Илья Владимирович

Как разделить авторов с одинаковыми именами?
Построение коллективов для различных отраслей науки.
Кластеризация построенных коллективов на основе анализа полных текстов.

Слайд 11

Учет цитирований

Учет цитирований

Слайд 12

Пример коллективов

Пример коллективов

Слайд 13

Слайд 14

Анализ активности коллектива

Анализ активности коллектива

Слайд 15

Пример 2: оценка качества научного журнала

Пример 2: оценка качества научного журнала

Слайд 16

Как сейчас оценивается журнал? Экспертным путем. С использованием наукометрии. Комбинированный метод

Как сейчас оценивается журнал?

Экспертным путем.
С использованием наукометрии.
Комбинированный метод (RSCI).
Дополнительных характеристики журнала,

которые можно получить на основе анализа полных текстов:
качество статей;
тематическая структура журнала;
заимствования;
выявление накруток цитирований;

Слайд 17

Обнаружение накрутки цитирований Спам. Массовая публикация коротких тезисов с большими списками

Обнаружение накрутки цитирований

Спам. Массовая публикация коротких тезисов с большими списками

цитирования. Как определить:
вычислить реальный размер публикации и соотносить его с количеством источников.
Ложное цитирование. Приписка цитирований статей, которые не используются в исследовании.
Как обнаружить:
определить тематическое соответствие контекстов, тематики и наличия реальных ссылок в текстах публикаций.
Клонирование и плагиат. Публикация нечетких дубликатов с измененным названием и текстом. Что делать:
Использовать средства поиска текстовых заимствований.
Сопоставлять списки цитирования (см. Гуреев В.Н., Мазов Н.А. Анализ цитирования как основа для разработки дополнительного модуля в системах антиплагиата // НТИ. Сер.1.– 2013.–12.–С. 12-15
Слайд 18

Соотношение статей в журнале по типу авторства

Соотношение статей в журнале по типу авторства

Слайд 19

Тематическая структура журнала

Тематическая структура журнала

Слайд 20

Проверка оригинальности статей

Проверка оригинальности статей

Слайд 21

Поддержка исследований грантами

Поддержка исследований грантами

Слайд 22

Пример 3: анализ научных направлений

Пример 3: анализ научных направлений

Слайд 23

Как сейчас выявляют научные направления? * Увы, российские публикации плохо цитируются

Как сейчас выявляют научные направления?
* Увы, российские публикации плохо цитируются и

ни одного российского направления исследований мы не найдем.
Слайд 24

Пример: российские патенты «оптогенетика» в Exactus Patent

Пример: российские патенты «оптогенетика» в Exactus Patent

Слайд 25

Пример: коллектив по «оптогенетике» в Exactus Expert

Пример: коллектив по «оптогенетике» в Exactus Expert

Слайд 26

Пример: российские коллективы по «оптогенетике» * Исходя из полученных данных можно

Пример: российские коллективы по «оптогенетике»
* Исходя из полученных данных можно

сделать вывод, что в России существует минимум 3 коллектива, которые занимаются оптогенетикой.
Слайд 27

«Квантовый компьютер» Наибольший интерес российского научного сообщества к квантовым компьютерам приходится

«Квантовый компьютер»
Наибольший интерес российского научного сообщества к квантовым компьютерам приходится на

2007-2010 гг., после чего количество авторефератов и публикаций снижается. При этом за всплеском защит в 2008-2010 годах не последовал стремительный рост патентной активности. Вероятно, сейчас данное направление находится в стадии переосмысления, после чего может начаться как рост, так и дальнейшее угасание направления.
Прогноз: Вероятно, сейчас данное направление находится в стадии переосмысления подходов и поиска новых методов, далее может пойти как в новый всплеск, так и дальнейшее угасание направления.