Методы оптимизации в машинном обучении 2023 — различия между версиями
Dkropotov (обсуждение | вклад) |
Dkropotov (обсуждение | вклад) (→Лекции и семинары) |
||
Строка 71: | Строка 71: | ||
| Метод сопряжённых градиентов. || [https://drive.google.com/file/d/1Ai3ZSuLTb0C6hL5KcAvagzJgKqL1-ySo/view?usp=sharing Презентация] | | Метод сопряжённых градиентов. || [https://drive.google.com/file/d/1Ai3ZSuLTb0C6hL5KcAvagzJgKqL1-ySo/view?usp=sharing Презентация] | ||
|- | |- | ||
− | | align="center"| | + | | align="center"|-- |
| 24 февраля 2023 | | 24 февраля 2023 | ||
+ | | ''Занятия не будет'' || | ||
+ | |- | ||
+ | | align="center"|6 | ||
+ | | 03 марта 2023 | ||
| Безгессианный метод Ньютона. Выпуклые множества. || [https://drive.google.com/file/d/1t9_Uvo-xrVd_nIVUk4CGXGfebHcFtTkw/view?usp=sharing Конспект] | | Безгессианный метод Ньютона. Выпуклые множества. || [https://drive.google.com/file/d/1t9_Uvo-xrVd_nIVUk4CGXGfebHcFtTkw/view?usp=sharing Конспект] | ||
|- | |- | ||
| align="center"|7 | | align="center"|7 | ||
− | | | + | | 10 марта 2023 |
| Квазиньютоновские методы оптимизации. Выпуклые функции. || [https://drive.google.com/file/d/1glvkT1g6C405RT773KwUdKYRW_bhOKct/view?usp=sharing Конспект] | | Квазиньютоновские методы оптимизации. Выпуклые функции. || [https://drive.google.com/file/d/1glvkT1g6C405RT773KwUdKYRW_bhOKct/view?usp=sharing Конспект] | ||
[http://www.machinelearning.ru/wiki/images/1/10/MOMO18_Seminar6.pdf Конспект] | [http://www.machinelearning.ru/wiki/images/1/10/MOMO18_Seminar6.pdf Конспект] | ||
|- | |- | ||
| align="center"|8 | | align="center"|8 | ||
− | | | + | | 17 марта 2023 |
| Задачи условной оптимизации. Теорема Каруша-Куна-Таккера. || [http://www.machinelearning.ru/wiki/images/7/7f/MOMO18_Seminar7.pdf Конспект] | | Задачи условной оптимизации. Теорема Каруша-Куна-Таккера. || [http://www.machinelearning.ru/wiki/images/7/7f/MOMO18_Seminar7.pdf Конспект] | ||
|- | |- | ||
| align="center"|9 | | align="center"|9 | ||
− | | | + | | 24 марта 2023 |
| Задача линейного программирования. Симплекс-метод. Эквивалентные преобразования задач оптимизации. Стандартные классы выпуклых условных задач оптимизации. || [https://drive.google.com/file/d/1ghnO3gMssx2IS9LaaOgYXbwwq6Pm8ZXY/view?usp=sharing Конспект] | | Задача линейного программирования. Симплекс-метод. Эквивалентные преобразования задач оптимизации. Стандартные классы выпуклых условных задач оптимизации. || [https://drive.google.com/file/d/1ghnO3gMssx2IS9LaaOgYXbwwq6Pm8ZXY/view?usp=sharing Конспект] | ||
− | |||
− | |||
− | |||
− | |||
|- | |- | ||
| align="center"|-- | | align="center"|-- | ||
Строка 96: | Строка 96: | ||
| ''Занятия не будет'' || | | ''Занятия не будет'' || | ||
|- | |- | ||
− | | align="center"| | + | | align="center"|10 |
| 7 апреля 2023 | | 7 апреля 2023 | ||
+ | | Метод Ньютона и метод логарифмических барьеров для решения выпуклых задач условной оптимизации. Применение метода лог. барьеров для двойственной задачи в SVM. || [http://www.machinelearning.ru/wiki/images/8/81/MOMO12_ipm.pdf Конспект]<br> | ||
+ | |- | ||
+ | | align="center"|11 | ||
+ | | 14 апреля 2023 | ||
| Прямо-двойственные методы для решения выпуклых задач условной оптимизации. || | | Прямо-двойственные методы для решения выпуклых задач условной оптимизации. || | ||
|- | |- | ||
| align="center"|12 | | align="center"|12 | ||
− | | | + | | 21 апреля 2023 |
| Негладкая выпуклая оптимизация. Субградиентный метод. Субдифференциальное исчисление. || [http://www.machinelearning.ru/wiki/images/e/e5/MOMO18_Seminar10.pdf Конспект] | | Негладкая выпуклая оптимизация. Субградиентный метод. Субдифференциальное исчисление. || [http://www.machinelearning.ru/wiki/images/e/e5/MOMO18_Seminar10.pdf Конспект] | ||
|- | |- | ||
| align="center"|13 | | align="center"|13 | ||
− | | | + | | 28 апреля 2023 |
| Проксимальные методы оптимизации. Сопряженные функции и нормы. || [http://www.machinelearning.ru/wiki/images/1/15/MOMO18_Seminar8.pdf Конспект] | | Проксимальные методы оптимизации. Сопряженные функции и нормы. || [http://www.machinelearning.ru/wiki/images/1/15/MOMO18_Seminar8.pdf Конспект] | ||
− | |||
− | |||
− | |||
− | |||
|- | |- | ||
| align="center"|-- | | align="center"|-- | ||
| 5 мая 2023 | | 5 мая 2023 | ||
| ''Занятия не будет'' || | | ''Занятия не будет'' || | ||
+ | |- | ||
+ | | align="center"|14 | ||
+ | | 12 апреля 2023 | ||
+ | | Стохастическая оптимизация: методы SGD, SAG, SVRG. Проекции и проксимальные операторы. || | ||
|- | |- | ||
| align="center"|15 | | align="center"|15 | ||
− | | | + | | 19 мая 2023 |
| Стохастическая оптимизация: методы SQN, NIM, Adagrad, RMSprop, ADAM. Автоматическое дифференцирование по графу вычислений. || [https://arxiv.org/abs/1401.7020 Статья 1]<br> [https://proceedings.mlr.press/v48/rodomanov16.html Статья 2] | | Стохастическая оптимизация: методы SQN, NIM, Adagrad, RMSprop, ADAM. Автоматическое дифференцирование по графу вычислений. || [https://arxiv.org/abs/1401.7020 Статья 1]<br> [https://proceedings.mlr.press/v48/rodomanov16.html Статья 2] | ||
|- | |- | ||
| align="center"|16 | | align="center"|16 | ||
− | | | + | | 26 мая 2023 |
| Дифференцирование через процесс оптимизации. || [https://arxiv.org/abs/1703.00443 Статья 1]<br> [https://arxiv.org/abs/1502.03492 Статья 2] | | Дифференцирование через процесс оптимизации. || [https://arxiv.org/abs/1703.00443 Статья 1]<br> [https://arxiv.org/abs/1502.03492 Статья 2] | ||
|- | |- |
Версия 15:38, 31 января 2023
Методы оптимизации лежат в основе решения многих задач компьютерных наук. Например, в машинном обучении задачу оптимизации необходимо решать каждый раз при настройке какой-то модели алгоритмов по данным, причём от эффективности решения соответствующей задачи оптимизации зависит практическая применимость самого метода машинного обучения. Данный курс посвящен изучению классических и современных методов решения задач непрерывной оптимизации (в том числе невыпуклых), а также особенностям применения этих методов в задачах оптимизации, возникающих в машинном обучении. Основной акцент в изложении делается на практические аспекты реализации и использования методов. Целью курса является выработка у слушателей навыков по подбору подходящего метода для своей задачи, наиболее полно учитывающего её особенности.
Преподаватели: Кропотов Дмитрий Александрович, Кодрян Максим, Никоров Кирилл.
Группа | Расписание | Инвайт для anytask |
---|---|---|
201 | пятница, лекция в 13:00, семинар в 14:40, ауд. см. в РУЗе | nuYXlzP |
202 | пятница, лекция в 13:00, семинар в 14:40, ауд. см. в РУЗе | Zus8FGK |
203 | пятница, лекция в 13:00, семинар в 14:40, ауд. см. в РУЗе | H85FCXe |
Другие студенты | пятница, лекция в 13:00, можно выбрать семинар любой из групп 201, 202, 203 | ml0iZHo |
Группа в Telegram для вопросов по курсу: ссылка
Видеозаписи занятий: ссылка
Система выставления оценок по курсу
В рамках курса предполагается четыре теоретических и четыре практических домашних заданий, а также экзамен в конце курса. Каждое задание и экзамен оцениваются исходя из 10-ти баллов. За задания можно получить дополнительные баллы за выполнение бонусных пунктов. Общая оценка за курс вычисляется по правилу Округление_вверх(0.7*<Оценка_за_семестр> + 0.3*<Оценка_за_экзамен>). <Оценка_за_семестр> = min(10, <Суммарная_оценка_за_задания>*10 / <Максимальная_суммарная_оценка_за_задания_без_бонусов>). Итоговая оценка за курс совпадает с общей оценкой при соблюдении следующих дополнительных условий:
Итоговая оценка | Условия |
---|---|
>=8 | Сданы все задания, кроме одного (на оценку >= 3 без учета опоздания), экзамен сдан на оценку >= 6 |
>=6 | Сданы все задания, кроме двух (на оценку >= 3 без учета опоздания), экзамен сдан на оценку >= 4 |
>=4 | Сданы все задания, кроме четырех (на оценку >= 3 без учета опоздания), экзамен сдан на оценку >= 4 |
Правила сдачи заданий
Теоретические и практические задания сдаются в систему anytask (инвайт см. выше). В случае наличия мягкого дедлайна задания могут быть присланы после срока сдачи, но с задержкой не более одной недели. При этом начисляется штраф из расчёта 0.5 балла в день. Все задания выполняются самостоятельно. Если задание выполнялось сообща или использовались какие-либо сторонние коды и материалы, то об этом должно быть написано в отчёте. В противном случае «похожие» решения считаются плагиатом и все задействованные студенты (в том числе те, у кого списали) будут сурово наказаны.
Теоретические задания сдаются в anytask в виде сканов или набранных в TeX pdf-файлов. ВАЖНО! Присылаемые сканы должны быть высокого качества, присылаться одним файлом, в котором все листы идут в правильном порядке. В случае плохого качества сканов или же сдачи в формате, отличном от pdf, проверяющий имеет право поставить за работу 0, не проверяя.
В случае возникновения проблем с anytask в процессе сдачи заданий перед дедлайном следует поступать так: прислать выполненное задание в телеграм своему семинаристу, а затем в anytask написать, что задание было прислано в телеграм вместе с указанием ника в телеграме.
Лекции и семинары
№ п/п | Дата | Занятие | Материалы |
---|---|---|---|
1 | 20 января 2023 | Введение в курс. Скорости сходимости итерационных процессов. Матрично-векторное дифференцирование. | Конспект |
2 | 27 января 2023 | Классы функций для оптимизации. Точная и неточная одномерная оптимизация | Конспект |
3 | 03 февраля 2023 | Метод градиентного спуска. Разностное дифференцирование. | |
4 | 10 февраля 2023 | Стандартные матричные разложения. Метод Ньютона. | Презентация по подготовке отчётов |
5 | 17 февраля 2023 | Метод сопряжённых градиентов. | Презентация |
-- | 24 февраля 2023 | Занятия не будет | |
6 | 03 марта 2023 | Безгессианный метод Ньютона. Выпуклые множества. | Конспект |
7 | 10 марта 2023 | Квазиньютоновские методы оптимизации. Выпуклые функции. | Конспект |
8 | 17 марта 2023 | Задачи условной оптимизации. Теорема Каруша-Куна-Таккера. | Конспект |
9 | 24 марта 2023 | Задача линейного программирования. Симплекс-метод. Эквивалентные преобразования задач оптимизации. Стандартные классы выпуклых условных задач оптимизации. | Конспект |
-- | 31 марта 2023 | Занятия не будет | |
10 | 7 апреля 2023 | Метод Ньютона и метод логарифмических барьеров для решения выпуклых задач условной оптимизации. Применение метода лог. барьеров для двойственной задачи в SVM. | Конспект |
11 | 14 апреля 2023 | Прямо-двойственные методы для решения выпуклых задач условной оптимизации. | |
12 | 21 апреля 2023 | Негладкая выпуклая оптимизация. Субградиентный метод. Субдифференциальное исчисление. | Конспект |
13 | 28 апреля 2023 | Проксимальные методы оптимизации. Сопряженные функции и нормы. | Конспект |
-- | 5 мая 2023 | Занятия не будет | |
14 | 12 апреля 2023 | Стохастическая оптимизация: методы SGD, SAG, SVRG. Проекции и проксимальные операторы. | |
15 | 19 мая 2023 | Стохастическая оптимизация: методы SQN, NIM, Adagrad, RMSprop, ADAM. Автоматическое дифференцирование по графу вычислений. | Статья 1 Статья 2 |
16 | 26 мая 2023 | Дифференцирование через процесс оптимизации. | Статья 1 Статья 2 |
Рекомендуемая литература
1. J. Nocedal, S. Wright. Numerical optimization. Springer, 2006.
2. S. Boyd, L. Vandenberghe. Convex optimization. Cambridge University Press, 2004.