Обзор и план развития ML направления 2022

Слайд 2

Результаты работы в 2021 году Команда: 4 разработчика Затраты: 1. Общий

Результаты работы в 2021 году

Команда: 4 разработчика

Затраты:
1. Общий бюджет на ML

команду: 7 млн. рублей
2. Затрата на разработку 1 модели: 350 тыс. рублей
3. Времени на 1 модель в среднем: 54 дня

Встроены в платформу:
9 моделей:
5 моделей госпитализации в течении 12 месяцев (для пациентов с ССЗ, сахарным диабетом, наркологическими, гинекологическими и легочными заболеваниями)
2 модели по гранту ПетрГУ (атеросклеротические бляшки, преэклампсия)
2 модели по предсказания смертности при диабете 2го типа (в течение 1 года и 5 лет)
Разработаны по другим проектам:
4 модели прогнозирования смертности (по проекту ЦНИИОЗ)
7 моделей для прогнозирования выживаемости после операций стентирования, шунтирования коронарных артерий (проект Бакулева)

Слайд 3

Результаты работы в 2021 году Модели встроенные в платформу

Результаты работы в 2021 году
Модели встроенные в платформу

Слайд 4

Текущая команда и обязанности Разработчики моделей Аналитик Лидер команды Анализ и

Текущая команда и обязанности

Разработчики моделей

Аналитик

Лидер команды

Анализ и подготовка данных
Разработка моделей
Подготовка отчетности

по моделям

Работа с документацией (подготовка ТЗ, проверка паспортов, отчетов, ведение статистики по разработанным моделям)
AD-HOC, POST-HOC анализ данных (подготовка и анализ данных для нужд команды, техническое тестирование разработанных моделей)

Контроль выполнения задач
Разработка моделей
Выбор технических подходов для реализации алгоритмов (исследование SOTA подходов, их тестирование и внедрение, выбор и внедрение DS инструментов для разработки)
Развитие разработчиков моделей (код ревью, разбор ошибок)

Слайд 5

Слабые места в ML Проблемы: 1. Качество данных 2. Структура базы

Слабые места в ML

Проблемы:
1. Качество данных
2. Структура базы данных
Предложения:
1. Создание

нового хранилища на основе Webiomed.Dataset с более продвинутой фильтрацией и удобной структурой хранения данных

Доступность и качество данных

Проблемы:
1. Нет структуры отчетов, презентаций
2. Нет четкого плана и приоритета по разработке моделей
3. “Бюрократия” (долгая выдача доступов к внутренним ресурсам, трудо пробовать что-то новое)
Предложения:
1. Разработка структуры типового отчета, презентации
2. Разработка плана по моделям выбор ключевых направлений
3. Упросить внутреннее взаимодействие

Тестирование моделей

Проблемы:
1. Нет тестирования
Предложения:
1. Выделить время медицинского эксперта на тестирование моделей (2 дня на модель)

Организация процессов

Слайд 6

Процесс разработки моделей Разработка ТЗ 1. Аналитик 2. Врач 2 дня

Процесс разработки моделей

Разработка ТЗ

1. Аналитик
2. Врач

2 дня + 1 день на

передачу разработчику

Сбор
данных

1. Разработчик

5 дней

Анализ и подготовка данных

1. Разработчик

5 дней

Разработка модели

1. Разработчик

5 дней

Мини презентация

1. Разработчик

1 день

Тестирование модели

1. Врач

2 дня

Написание кода

1. Разработчик

2 дня

Отчет, паспорт, презентация

1. Разработчик
2. Аналитик

5 дней

Слайд 7

Подсчет времени разработки модели Производительность В 2022 году 247 рабочих дней

Подсчет времени разработки модели

Производительность
В 2022 году 247 рабочих дней или 219

дней, вычитая отпуск
1 разработчик - 8 моделей в год

Цикл разработки
1 модель - 28 рабочих дней (1.5 календарных месяца)

Слайд 8

Roadmap 2022 2023 Обкатываем новую базу август февраль- март Переходим в

Roadmap 2022

2023

Обкатываем новую базу

август

февраль-
март

Переходим в Яндекс Облако
Продумываем схему новой базы

для DS

2022

Ищем 1 DS (по ситуации)

февраль

Пробуем тестирование врачом на примере модели ОРВИ

март-
апрель