- Главная
- Образование
- Обзор и план развития ML направления 2022
Содержание
- 2. Результаты работы в 2021 году Команда: 4 разработчика Затраты: 1. Общий бюджет на ML команду: 7
- 3. Результаты работы в 2021 году Модели встроенные в платформу
- 4. Текущая команда и обязанности Разработчики моделей Аналитик Лидер команды Анализ и подготовка данных Разработка моделей Подготовка
- 5. Слабые места в ML Проблемы: 1. Качество данных 2. Структура базы данных Предложения: 1. Создание нового
- 6. Процесс разработки моделей Разработка ТЗ 1. Аналитик 2. Врач 2 дня + 1 день на передачу
- 7. Подсчет времени разработки модели Производительность В 2022 году 247 рабочих дней или 219 дней, вычитая отпуск
- 8. Roadmap 2022 2023 Обкатываем новую базу август февраль- март Переходим в Яндекс Облако Продумываем схему новой
- 10. Скачать презентацию
Результаты работы в 2021 году
Команда: 4 разработчика
Затраты:
1. Общий бюджет на ML
Результаты работы в 2021 году
Команда: 4 разработчика
Затраты:
1. Общий бюджет на ML
2. Затрата на разработку 1 модели: 350 тыс. рублей
3. Времени на 1 модель в среднем: 54 дня
Встроены в платформу:
9 моделей:
5 моделей госпитализации в течении 12 месяцев (для пациентов с ССЗ, сахарным диабетом, наркологическими, гинекологическими и легочными заболеваниями)
2 модели по гранту ПетрГУ (атеросклеротические бляшки, преэклампсия)
2 модели по предсказания смертности при диабете 2го типа (в течение 1 года и 5 лет)
Разработаны по другим проектам:
4 модели прогнозирования смертности (по проекту ЦНИИОЗ)
7 моделей для прогнозирования выживаемости после операций стентирования, шунтирования коронарных артерий (проект Бакулева)
Результаты работы в 2021 году
Модели встроенные в платформу
Результаты работы в 2021 году
Модели встроенные в платформу
Текущая команда и обязанности
Разработчики моделей
Аналитик
Лидер команды
Анализ и подготовка данных
Разработка моделей
Подготовка отчетности
Текущая команда и обязанности
Разработчики моделей
Аналитик
Лидер команды
Анализ и подготовка данных
Разработка моделей
Подготовка отчетности
Работа с документацией (подготовка ТЗ, проверка паспортов, отчетов, ведение статистики по разработанным моделям)
AD-HOC, POST-HOC анализ данных (подготовка и анализ данных для нужд команды, техническое тестирование разработанных моделей)
Контроль выполнения задач
Разработка моделей
Выбор технических подходов для реализации алгоритмов (исследование SOTA подходов, их тестирование и внедрение, выбор и внедрение DS инструментов для разработки)
Развитие разработчиков моделей (код ревью, разбор ошибок)
Слабые места в ML
Проблемы:
1. Качество данных
2. Структура базы данных
Предложения:
1. Создание
Слабые места в ML
Проблемы:
1. Качество данных
2. Структура базы данных
Предложения:
1. Создание
Доступность и качество данных
Проблемы:
1. Нет структуры отчетов, презентаций
2. Нет четкого плана и приоритета по разработке моделей
3. “Бюрократия” (долгая выдача доступов к внутренним ресурсам, трудо пробовать что-то новое)
Предложения:
1. Разработка структуры типового отчета, презентации
2. Разработка плана по моделям выбор ключевых направлений
3. Упросить внутреннее взаимодействие
Тестирование моделей
Проблемы:
1. Нет тестирования
Предложения:
1. Выделить время медицинского эксперта на тестирование моделей (2 дня на модель)
Организация процессов
Процесс разработки моделей
Разработка ТЗ
1. Аналитик
2. Врач
2 дня + 1 день на
Процесс разработки моделей
Разработка ТЗ
1. Аналитик
2. Врач
2 дня + 1 день на
Сбор
данных
1. Разработчик
5 дней
Анализ и подготовка данных
1. Разработчик
5 дней
Разработка модели
1. Разработчик
5 дней
Мини презентация
1. Разработчик
1 день
Тестирование модели
1. Врач
2 дня
Написание кода
1. Разработчик
2 дня
Отчет, паспорт, презентация
1. Разработчик
2. Аналитик
5 дней
Подсчет времени разработки модели
Производительность
В 2022 году 247 рабочих дней или 219
Подсчет времени разработки модели
Производительность
В 2022 году 247 рабочих дней или 219
1 разработчик - 8 моделей в год
Цикл разработки
1 модель - 28 рабочих дней (1.5 календарных месяца)
Roadmap 2022
2023
Обкатываем новую базу
август
февраль-
март
Переходим в Яндекс Облако
Продумываем схему новой базы
Roadmap 2022
2023
Обкатываем новую базу
август
февраль-
март
Переходим в Яндекс Облако
Продумываем схему новой базы
2022
Ищем 1 DS
(по ситуации)
февраль
Пробуем тестирование врачом на примере модели ОРВИ
март-
апрель