Методы оптимизации в машинном обучении 2023 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 48: Строка 48:
 
|-
 
|-
 
| align="center"|1
 
| align="center"|1
| 18 января 2022
+
| 20 января 2023
 
| Введение в курс. Скорости сходимости итерационных процессов. Матрично-векторное дифференцирование. || [https://drive.google.com/file/d/1MXENV3Ryy8SgK3_q_lKB5gBG39qcl8_M/view?usp=sharing Конспект]
 
| Введение в курс. Скорости сходимости итерационных процессов. Матрично-векторное дифференцирование. || [https://drive.google.com/file/d/1MXENV3Ryy8SgK3_q_lKB5gBG39qcl8_M/view?usp=sharing Конспект]
 
[https://drive.google.com/file/d/1bNWF262guJHTphptCTYARAsUKRPC9QmS/view?usp=sharing Конспект]
 
[https://drive.google.com/file/d/1bNWF262guJHTphptCTYARAsUKRPC9QmS/view?usp=sharing Конспект]
 
|-
 
|-
 
| align="center"|2
 
| align="center"|2
| 25 января 2022
+
| 27 января 2023
 
| Классы функций для оптимизации. Точная и неточная одномерная оптимизация || [http://www.machinelearning.ru/wiki/images/4/4d/MOMO16_min1d.pdf Конспект]
 
| Классы функций для оптимизации. Точная и неточная одномерная оптимизация || [http://www.machinelearning.ru/wiki/images/4/4d/MOMO16_min1d.pdf Конспект]
 
|-
 
|-
 
| align="center"|3
 
| align="center"|3
| 01 февраля 2022
+
| 03 февраля 2023
 
| Метод градиентного спуска. Разностное дифференцирование. ||  
 
| Метод градиентного спуска. Разностное дифференцирование. ||  
 
|-
 
|-
 
| align="center"|4
 
| align="center"|4
| 08 февраля 2022
+
| 10 февраля 2023
 
| Стандартные матричные разложения. Метод Ньютона. || [https://drive.google.com/file/d/1K9xt0seQ_Oi0UcyziwHibhnr7PorNfqe/view?usp=sharing Презентация по подготовке отчётов]
 
| Стандартные матричные разложения. Метод Ньютона. || [https://drive.google.com/file/d/1K9xt0seQ_Oi0UcyziwHibhnr7PorNfqe/view?usp=sharing Презентация по подготовке отчётов]
 
|-
 
|-
 
| align="center"|5
 
| align="center"|5
| 15 февраля 2022
+
| 17 февраля 2023
 
| Метод сопряжённых градиентов. || [https://drive.google.com/file/d/1Ai3ZSuLTb0C6hL5KcAvagzJgKqL1-ySo/view?usp=sharing Презентация]
 
| Метод сопряжённых градиентов. || [https://drive.google.com/file/d/1Ai3ZSuLTb0C6hL5KcAvagzJgKqL1-ySo/view?usp=sharing Презентация]
 
|-
 
|-
 
| align="center"|6
 
| align="center"|6
| 22 февраля 2022
+
| 24 февраля 2023
 
| Безгессианный метод Ньютона. Выпуклые множества. || [https://drive.google.com/file/d/1t9_Uvo-xrVd_nIVUk4CGXGfebHcFtTkw/view?usp=sharing Конспект]
 
| Безгессианный метод Ньютона. Выпуклые множества. || [https://drive.google.com/file/d/1t9_Uvo-xrVd_nIVUk4CGXGfebHcFtTkw/view?usp=sharing Конспект]
 
|-
 
|-
 
| align="center"|7
 
| align="center"|7
| 01 марта 2022
+
| 03 марта 2023
 
| Квазиньютоновские методы оптимизации. Выпуклые функции. || [https://drive.google.com/file/d/1glvkT1g6C405RT773KwUdKYRW_bhOKct/view?usp=sharing Конспект]
 
| Квазиньютоновские методы оптимизации. Выпуклые функции. || [https://drive.google.com/file/d/1glvkT1g6C405RT773KwUdKYRW_bhOKct/view?usp=sharing Конспект]
 
[http://www.machinelearning.ru/wiki/images/1/10/MOMO18_Seminar6.pdf Конспект]
 
[http://www.machinelearning.ru/wiki/images/1/10/MOMO18_Seminar6.pdf Конспект]
|-
 
| align="center"|--
 
| 08 марта 2022
 
| ''Занятия не будет'' ||
 
 
|-
 
|-
 
| align="center"|8
 
| align="center"|8
| 15 марта 2022
+
| 10 марта 2023
 
| Задачи условной оптимизации. Теорема Каруша-Куна-Таккера. || [http://www.machinelearning.ru/wiki/images/7/7f/MOMO18_Seminar7.pdf Конспект]
 
| Задачи условной оптимизации. Теорема Каруша-Куна-Таккера. || [http://www.machinelearning.ru/wiki/images/7/7f/MOMO18_Seminar7.pdf Конспект]
 
|-
 
|-
 
| align="center"|9
 
| align="center"|9
| 22 марта 2022
+
| 17 марта 2023
 
| Задача линейного программирования. Симплекс-метод. Эквивалентные преобразования задач оптимизации. Стандартные классы выпуклых условных задач оптимизации. || [https://drive.google.com/file/d/1ghnO3gMssx2IS9LaaOgYXbwwq6Pm8ZXY/view?usp=sharing Конспект]
 
| Задача линейного программирования. Симплекс-метод. Эквивалентные преобразования задач оптимизации. Стандартные классы выпуклых условных задач оптимизации. || [https://drive.google.com/file/d/1ghnO3gMssx2IS9LaaOgYXbwwq6Pm8ZXY/view?usp=sharing Конспект]
 +
|-
 +
| align="center"|10
 +
| 24 марта 2023
 +
| Метод Ньютона и метод логарифмических барьеров для решения выпуклых задач условной оптимизации. Применение метода лог. барьеров для двойственной задачи в SVM. || [http://www.machinelearning.ru/wiki/images/8/81/MOMO12_ipm.pdf Конспект]<br>
 
|-
 
|-
 
| align="center"|--
 
| align="center"|--
| 29&nbsp;марта&nbsp;2022
+
| 31&nbsp;марта&nbsp;2023
 
| ''Занятия не будет'' ||  
 
| ''Занятия не будет'' ||  
|-
 
| align="center"|10
 
| 05&nbsp;апреля&nbsp;2022
 
| Метод Ньютона и метод логарифмических барьеров для решения выпуклых задач условной оптимизации. Применение метода лог. барьеров для двойственной задачи в SVM. || [http://www.machinelearning.ru/wiki/images/8/81/MOMO12_ipm.pdf Конспект]<br>
 
 
|-
 
|-
 
| align="center"|11
 
| align="center"|11
| 12&nbsp;апреля&nbsp;2022
+
| 7&nbsp;апреля&nbsp;2023
 
| Прямо-двойственные методы для решения выпуклых задач условной оптимизации. ||  
 
| Прямо-двойственные методы для решения выпуклых задач условной оптимизации. ||  
 
|-
 
|-
 
| align="center"|12
 
| align="center"|12
| 19&nbsp;апреля&nbsp;2022
+
| 14&nbsp;апреля&nbsp;2023
 
| Негладкая выпуклая оптимизация. Субградиентный метод. Субдифференциальное исчисление. || [http://www.machinelearning.ru/wiki/images/e/e5/MOMO18_Seminar10.pdf Конспект]
 
| Негладкая выпуклая оптимизация. Субградиентный метод. Субдифференциальное исчисление. || [http://www.machinelearning.ru/wiki/images/e/e5/MOMO18_Seminar10.pdf Конспект]
 
|-
 
|-
 
| align="center"|13
 
| align="center"|13
| 26&nbsp;апреля&nbsp;2022
+
| 21&nbsp;апреля&nbsp;2023
 
| Проксимальные методы оптимизации. Сопряженные функции и нормы. || [http://www.machinelearning.ru/wiki/images/1/15/MOMO18_Seminar8.pdf Конспект]
 
| Проксимальные методы оптимизации. Сопряженные функции и нормы. || [http://www.machinelearning.ru/wiki/images/1/15/MOMO18_Seminar8.pdf Конспект]
 
|-
 
|-
| align="center"|--
+
| align="center"|14
| 3&nbsp;мая&nbsp;2022
+
| 28&nbsp;апреля&nbsp;2023
| ''Занятия не будет'' ||  
+
| Стохастическая оптимизация: методы SGD, SAG, SVRG. Проекции и проксимальные операторы. ||  
 
|-
 
|-
 
| align="center"|--
 
| align="center"|--
| 10&nbsp;мая&nbsp;2022
+
| 5&nbsp;мая&nbsp;2023
 
| ''Занятия не будет'' ||  
 
| ''Занятия не будет'' ||  
|-
 
| align="center"|14
 
| 17&nbsp;мая&nbsp;2022
 
| Стохастическая оптимизация: методы SGD, SAG, SVRG. Проекции и проксимальные операторы. ||
 
 
|-
 
|-
 
| align="center"|15
 
| align="center"|15
| 24&nbsp;мая&nbsp;2022
+
| 12&nbsp;мая&nbsp;2023
 
| Стохастическая оптимизация: методы SQN, NIM, Adagrad, RMSprop, ADAM. Автоматическое дифференцирование по графу вычислений. || [https://arxiv.org/abs/1401.7020 Статья 1]<br> [https://proceedings.mlr.press/v48/rodomanov16.html Статья 2]
 
| Стохастическая оптимизация: методы SQN, NIM, Adagrad, RMSprop, ADAM. Автоматическое дифференцирование по графу вычислений. || [https://arxiv.org/abs/1401.7020 Статья 1]<br> [https://proceedings.mlr.press/v48/rodomanov16.html Статья 2]
 
|-
 
|-
 
| align="center"|16
 
| align="center"|16
| 31&nbsp;мая&nbsp;2022
+
| 19&nbsp;мая&nbsp;2023
 
| Дифференцирование через процесс оптимизации. || [https://arxiv.org/abs/1703.00443 Статья 1]<br> [https://arxiv.org/abs/1502.03492 Статья 2]
 
| Дифференцирование через процесс оптимизации. || [https://arxiv.org/abs/1703.00443 Статья 1]<br> [https://arxiv.org/abs/1502.03492 Статья 2]
 
|-
 
|-
 
|}
 
|}
 +
 +
== Рекомендуемая литература ==
 +
1. J. Nocedal, S. Wright. [https://www.csie.ntu.edu.tw/~r97002/temp/num_optimization.pdf Numerical optimization]. Springer, 2006.
 +
 +
2. S. Boyd, L. Vandenberghe. [https://web.stanford.edu/~boyd/cvxbook/ Convex optimization]. Cambridge University Press, 2004.

Версия 16:09, 17 января 2023


Внимание! Страница курса находится в стадии формирования.

Методы оптимизации лежат в основе решения многих задач компьютерных наук. Например, в машинном обучении задачу оптимизации необходимо решать каждый раз при настройке какой-то модели алгоритмов по данным, причём от эффективности решения соответствующей задачи оптимизации зависит практическая применимость самого метода машинного обучения. Данный курс посвящен изучению классических и современных методов решения задач непрерывной оптимизации (в том числе невыпуклых), а также особенностям применения этих методов в задачах оптимизации, возникающих в машинном обучении. Основной акцент в изложении делается на практические аспекты реализации и использования методов. Целью курса является выработка у слушателей навыков по подбору подходящего метода для своей задачи, наиболее полно учитывающего её особенности.

Преподаватели: Кропотов Дмитрий Александрович, Кодрян Максим, Никоров Кирилл.

Группа Расписание Инвайт для anytask
201 пятница, лекция в 13:00 (R405), семинар в 14:40 (R207) nuYXlzP
202 пятница, лекция в 13:00 (R405), семинар в 14:40 (R301) Zus8FGK
203 пятница, лекция в 13:00 (R405), семинар в 14:40 (R201) H85FCXe
Другие студенты пятница, лекция в 13:00 (R405), можно выбрать семинар любой из групп 201, 202, 203 ml0iZHo

Группа в Telegram для вопросов по курсу: ссылка

Система выставления оценок по курсу

В рамках курса предполагается четыре теоретических и четыре практических домашних заданий, а также экзамен в конце курса. Каждое задание и экзамен оцениваются исходя из 10-ти баллов. За задания можно получить дополнительные баллы за выполнение бонусных пунктов. Общая оценка за курс вычисляется по правилу Округление_вверх(0.7*<Оценка_за_семестр> + 0.3*<Оценка_за_экзамен>). <Оценка_за_семестр> = min(10, <Суммарная_оценка_за_задания>*10 / <Максимальная_суммарная_оценка_за_задания_без_бонусов>). Итоговая оценка за курс совпадает с общей оценкой при соблюдении следующих дополнительных условий:

Итоговая оценка Условия
>=8 Сданы все задания, кроме одного (на оценку >= 3), экзамен сдан на оценку >= 6
>=6 Сданы все задания, кроме двух (на оценку >= 3), экзамен сдан на оценку >= 4
>=4 Сданы все задания, кроме трех (на оценку >= 3), экзамен сдан на оценку >= 4

Правила сдачи заданий

Теоретические и практические задания сдаются в систему anytask (инвайт см. выше). В случае наличия мягкого дедлайна задания могут быть присланы после срока сдачи, но с задержкой не более одной недели. При этом начисляется штраф из расчёта 0.5 балла в день. Все задания выполняются самостоятельно. Если задание выполнялось сообща или использовались какие-либо сторонние коды и материалы, то об этом должно быть написано в отчёте. В противном случае «похожие» решения считаются плагиатом и все задействованные студенты (в том числе те, у кого списали) будут сурово наказаны.

Теоретические задания сдаются в anytask в виде сканов или набранных в TeX pdf-файлов. ВАЖНО! Присылаемые сканы должны быть высокого качества, присылаться одним файлом, в котором все листы идут в правильном порядке. В случае плохого качества сканов или же сдачи в формате, отличном от pdf, проверяющий имеет право поставить за работу 0, не проверяя.

Лекции и семинары

№ п/п Дата Занятие Материалы
1 20 января 2023 Введение в курс. Скорости сходимости итерационных процессов. Матрично-векторное дифференцирование. Конспект

Конспект

2 27 января 2023 Классы функций для оптимизации. Точная и неточная одномерная оптимизация Конспект
3 03 февраля 2023 Метод градиентного спуска. Разностное дифференцирование.
4 10 февраля 2023 Стандартные матричные разложения. Метод Ньютона. Презентация по подготовке отчётов
5 17 февраля 2023 Метод сопряжённых градиентов. Презентация
6 24 февраля 2023 Безгессианный метод Ньютона. Выпуклые множества. Конспект
7 03 марта 2023 Квазиньютоновские методы оптимизации. Выпуклые функции. Конспект

Конспект

8 10 марта 2023 Задачи условной оптимизации. Теорема Каруша-Куна-Таккера. Конспект
9 17 марта 2023 Задача линейного программирования. Симплекс-метод. Эквивалентные преобразования задач оптимизации. Стандартные классы выпуклых условных задач оптимизации. Конспект
10 24 марта 2023 Метод Ньютона и метод логарифмических барьеров для решения выпуклых задач условной оптимизации. Применение метода лог. барьеров для двойственной задачи в SVM. Конспект
-- 31 марта 2023 Занятия не будет
11 7 апреля 2023 Прямо-двойственные методы для решения выпуклых задач условной оптимизации.
12 14 апреля 2023 Негладкая выпуклая оптимизация. Субградиентный метод. Субдифференциальное исчисление. Конспект
13 21 апреля 2023 Проксимальные методы оптимизации. Сопряженные функции и нормы. Конспект
14 28 апреля 2023 Стохастическая оптимизация: методы SGD, SAG, SVRG. Проекции и проксимальные операторы.
-- 5 мая 2023 Занятия не будет
15 12 мая 2023 Стохастическая оптимизация: методы SQN, NIM, Adagrad, RMSprop, ADAM. Автоматическое дифференцирование по графу вычислений. Статья 1
Статья 2
16 19 мая 2023 Дифференцирование через процесс оптимизации. Статья 1
Статья 2

Рекомендуемая литература

1. J. Nocedal, S. Wright. Numerical optimization. Springer, 2006.

2. S. Boyd, L. Vandenberghe. Convex optimization. Cambridge University Press, 2004.