Генеративные модели в машинном обучении (ИИ 2025)
Содержание
О курсе
Курс читается в первом семестре студентам магистерской образовательной программы "Искусственный интеллект".
| Группа | Преподаватели |
|---|---|
| Базовая | Тихонова Мария, Кантонистова Елена |
| Продвинутая | Тихонова Мария, Карагодин Никита |
| Ассистенты | |||
|---|---|---|---|
| Уваров Николай | Матвеев Денис | Тихонов Даниил | |
| Прудников Николай | Хасенов Ильяс | Саргсян Нарек | |
| Герасимов Борис | Черников Олег | Семенов Иван | |
Материалы курса
Ссылка на плейлист курса на VK: VK-playlist
Ссылка на плейлист курса на YouTube: YouTube-playlist
Ссылка на GitHub с материалами курса: GitHub
Ссылка на stepik: Stepik
Расписание базовой группы:
| Занятие | Тема | Записи лекций и семинаров | Материалы на гитхабе | Дополнительные материалы |
|---|---|---|---|---|
| 1 | Задача машинного перевода, механизм внимания, Transformer | Лекция VK Семинар VK | [Лекция] [Семинар] | |
| 2 | Токенизация, BERT, дообучение трансформерных моделей | Лекция VK [Семинар] | [Лекция] [Семинар] | |
| 3 | Задача языкового моделирования, GPT, few-shot и zero-shot, инструктивное обучение | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 4 | Технологии современных LLM (Rope, KV-cache), Reasoning, RAG, Open-source LLM | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 5 | Нормализующие потоки | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 6 | Автокодировщики, вариационные автокодировщики | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 7 | Генеративно-состязательные сети, StyleGAN | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 8 | Диффузионные модели | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 9 | Мультимодальные модели, CLIP, Stable Diffusion | [Лекция] [Семинар] | [Лекция] [Семинар] |
Расписание продвинутой группы:
| Занятие | Тема | Записи лекций и семинаров | Материалы на гитхабе | Домашние задания |
|---|---|---|---|---|
| 1 | Применения генеративных моделей, метод максимального правдоподобия, энтропия и KL-дивергенция, задачи генеративных моделей, AR модели | Лекция VK Семинар VK | Лекция Семинар | ImageGPT |
| 2 | Задача машинного перевода, механизм внимания, Transformer | Лекция VK Семинар VK | [Лекция] [Семинар] | |
| 3 | Токенизация, BERT, дообучение трансформерных моделей | Лекция VK [Семинар] | [Лекция] [Семинар] | |
| 4 | Задача языкового моделирования, GPT, few-shot и zero-shot, инструктивное обучение | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 5 | Технологии современных LLM (Rope, KV-cache), Reasoning, RAG, Open-source LLM | [Лекция] [Семинар] | [Лекция] [Семинар] | |
| 6 | Нормализующие потоки, авторегрессионные и линейные потоки, модели NICE, RealNVP и Glow | Лекция VK Семинар VK | Лекция Семинар | Glow |
| 7 | Модели скрытых переменных, ЕМ-алгоритм, вывод вариационной нижней оценки (ELBO) | Лекция | Лекция VK | |
| 8 | Амортизированный вариационный вывод, трюк репараметризации, VAE, ELBO Surgery, Learnable Prior | Лекция VK Семинар VK | Лекция Семинар | |
| 9 | Discrete VAE, VQ-VAE, VQ-VAE2, likelihood free-learning, GANs | Лекция VK Лекция Ytb | Лекция | |
| 10 | Проблемы GANs: Mode collapse, Manifold Hypotesis; Wasserstain Distance, WGAN, WGAN-GP, PG-GAN, SAGAN, StyleGAN | Лекция VK Семинар VK Лекция Ytb | Лекция [Семинар] | |
| 11 | Energy based models, динамика Ланжевена, score matching: Implicit score matching, sliced score matching, denoising score matching, Noise conditioned score network | Лекция VK Лекция Ytb | [Лекция] [Семинар] | |
| 12 | Прямой и обратный диффузионные процессы, диффузия как модель VAE | Лекция VK [Семинар VK] Лекция Ytb | [Лекция] [Семинар] | |
| 13 | [Лекция] [Семинар] | [Лекция] [Семинар] |
Формула оценивания
Общая оценка: 𝟎.𝟔×ДЗ + 𝟎.𝟏×Степик + 𝟎.𝟏×Теормин + 𝟎.𝟐×Экзамен
Stepik
В оценку за Stepik идут только следующие модули:
Важно: Части степика с домашними заданиями делать не нужно (15.4, например). Но нужно ответить на квизы в других его частях (15.1, например).
Домашние задания
Инвайты в Anytask
Base Group: WhnrWvK
Pro Group: iYcTpI5
Base / Pro - мягкий дедлайн:
1. NLP / ImageGPT - дедлайн 12 октября 23:59
2. GAN&VAE / Glow - дедлайн 6 ноября 23:59
3. Diffusion&Flows / VQ VAE - 14 ноября 23:59
4. MM AR / GANs - 28 ноября 23:59
Жесткий дедлайн по всем заданиям: 1 декабря 2025*
- Для сдачи курса на зачет (4 балла) можно досдавать домашние задания после жесткого дедлайна - до 20 декабря 23:59. Только в случае, если речь идет про зачет/незачет. Выше оценки 4 в случае поздней досдачи получить нельзя.
Правила дедлайнов по курсу:
- за каждую неделю просрочки после мягкого дедлайна штраф 2 балла
- после трех недель просрочки штраф 6 баллов и он не увеличивается
- после трех недель просрочки и до -1 недели до конца модуля можно сдавать задания с максимальным баллом 4.
Теормин и Экзамен
Теормин - устный опрос по заранее фиксированному списку вопросов с кратким ответом. Необходимо ответить на 3 вопроса за не более, чем 5 минут.
- Теормин ожидается 1 декабря.
- Балл за теормин: 0 / 5 / 10.
Экзамен - устный разговор по темам курса, не более 10 минут, ожидаются развернутые ответы в свободной форме.
- На экзамен допускаются только те, кто получил полный балл (10) за теормин.
- Экзамен пройдет в сессию 2го модуля.