МОВС Открытый курс MLOps Начало (2023-24, 1 модуль) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (add 1st lecture slides)
м (add recording of the 1st lesson)
Строка 32: Строка 32:
 
  ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
  ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
|-
 
|-
| style="background:#eaecf0;" | '''1''' [[ Запись]] || [[https://stepik.org/media/attachments/course/181476/MLOps_inception_1.pdf Слайды]] MLOps интро. MLOps для регулярного обучения моделей: обзор стека AirFlow+MLFlow+S3 || 15.09.23 || ||  
+
| style="background:#eaecf0;" | '''1''' [[https://stepik.org/lesson/1074007/step/2?unit=1084079 Запись на Stepik]] || [[https://stepik.org/media/attachments/course/181476/MLOps_inception_1.pdf Слайды]] MLOps интро. MLOps для регулярного обучения моделей: обзор стека AirFlow+MLFlow+S3 || 15.09.23 || ||
 +
[https://www.youtube.com/watch?v=3ZWRMv5WBdw Вебинар] о продуктивизации ML-решений "От Jupyter Notebook до полноценного продукта"
 +
 
 +
[https://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html Почитать] про обучение моделей в sklearn
 
|-
 
|-
 
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Слайды]] Виртуальные машины и виртуальные окружения. Сетап необходимой инфраструктуры: установка и настройка AirFlow, MLFlow, S3. || 22.09.23 || ||  
 
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Слайды]] Виртуальные машины и виртуальные окружения. Сетап необходимой инфраструктуры: установка и настройка AirFlow, MLFlow, S3. || 22.09.23 || ||  

Версия 22:35, 16 сентября 2023

О курсе

Вы познакомитесь с концепцией MLOps, поймете, как именно Data Scientist использует DevOps и CI/CD в своих решениях, а также попробуете самостоятельно создать пайплайн обучения ML-модели с помощью AirFlow и версионировать свои эксперименты с помощью MLFlow. Ближе к концу участников интенсива ждет мини-проект по обучению ML-модели по расписанию.
Цель этого курса - научиться поднимать необходимое окружение для ML-экспериментов и грамотно версионировать свои результаты.


Занятия проводятся в Zoom по пятницам в 18:00

Этот же курс на платформе Stepik: https://stepik.org/course/181476/promo

Контакты

Чат курса в TG: https://t.me/+3kpj_Dt2BmBjZjA6

Преподаватель: Елизавета Гаврилова, Senior ML Engineer

Ассистент Telegram
Андрей @mr_dyadyunov

Материалы курса

Ссылка на плейлист курса на YouTube: YouTube-playlist

Ссылка на GitHub с материалами курса: GitHub repository

Занятие Тема Дата Материалы для самоподготовки к семинарам Дополнительные материалы
1 [Запись на Stepik] [Слайды] MLOps интро. MLOps для регулярного обучения моделей: обзор стека AirFlow+MLFlow+S3 15.09.23

Вебинар о продуктивизации ML-решений "От Jupyter Notebook до полноценного продукта"

Почитать про обучение моделей в sklearn

2 Запись Слайды Виртуальные машины и виртуальные окружения. Сетап необходимой инфраструктуры: установка и настройка AirFlow, MLFlow, S3. 22.09.23
3 Запись Слайды Что такое DAG? Мой первый DAG для обучения модели: из чего состоит пайплайн обучения? 29.09.23
4 Запись Слайды Обучение нескольких моделей одновременно. Чтение и хранение данных на S3. 06.10.23
5 Запись Слайды Установка и настройка MLFlow. Повторяем эксперимент, но теперь версионируем с помощью MLFlow. 13.10.23
6 Запись Слайды Обзор финального задания. Подводя итоги: сравнение кастомного версионирования с готового решения MLFlow. 20.10.23

Формула оценивания

Оценка = 0.4*ОТесты + 0.6*ОПроект

Описание проектов

Литература

  1. "Machine Learning Engineering" by Andriy Burkov, 2020
  2. "Practical MLOps: Operationalizing Machine Learning Models (2021)", Noah Gift & Alfredo Deza