Машинное обучение (ФЭН)
Содержание
О курсе
Преподаватели: Читает лекции Кантонистова Елена Олеговна, ведут семинары Демешев Борис Борисович, Филатов Артем Андреевич и Петросян Артур Тигранович.
Лекции проходят по пятницам, 12:10 - 13:30, ауд. 5214.
Семинары
Группа | Преподаватель | Учебный ассистент | Gitlab Username | Расписание |
---|---|---|---|---|
4 курс эконома | Борис Демешев | Анастасия Максимовская | anastasiyamax | пятница 10:30, ауд. 3316 |
3 курс эконома-1 | Артем Филатов | Анастасия Рогачевская | arogachewskaya | пятница 10:30, ауд. 3317 |
3 курс эконома-2 | Артур Петросян | Алексей Иванов | суббота 9:00, ауд. 3316 |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и выполнение теоретических домашних заданий
- Практические домашние работы на Python
- Соревнование по анализу данных
- Устный коллоквиум в конце 1-го модуля
- Устный экзамен
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз
Оценка за работу в семестре вычисляется по формуле
Oнакопленная = 0.2 * Oсамостоятельные + 0.6 * Одз + 0.2 * Околлоквиум
Накопленная и итоговая оценки округляются арифметически. Никакие промежуточные оценки, в том числе оценки за домашние задания, самостоятельные работы или коллоквиум, не округляются.
Оценка за самостоятельную работу вычисляется как сумма баллов по всем самостоятельным, переведенная в 10 бальную шкалу. Оценка за домашнюю работу — как сумма баллов по всем практическим заданиям и соревнованию, переведенная в 10 бальную шкалу. Количество баллов за разные задания может различаться в зависимости от их сложности.
По курсу возможно получение оценки автоматом без сдачи экзамена. Необходимым условием для получения автомата является накопленная оценка, равная 8 или выше.
Коллоквиум
Коллоквиум будет проведен 27 октября в аудитории 2309 с 9:00 до 12:00. Третий курс приходит к 9:00, четвертый курс - к 10:30.
Правила
- коллоквиум будет включать в себя теоретические вопросы и задачи
- список теоретических вопросов: ссылка
- задачи будут либо близки к задачам из теоретических домашних заданий, либо простыми задачами на понимание материала (например, на построение ROC-кривой для конкретных данных, на понимание формы разделяющей поверхности для разных методов классификации, на доказательство, что функция является ядром и т.д.)
- на подготовку и ответ будет выделено примерно по 10 минут
- пользоваться при подготовке ничем нельзя
Экзамен
Экзамен будет проведен 29 декабря в аудитории 5306 с 9:00 до 13:30.
Лекции
Лекция 1 (7 сентября). Введение в машинное обучение. Слайды
Лекция 2 (14 сентября). Линейные методы регрессии (аналитическое и численное решение задачи МНК, градиентный спуск, методы оценивания градиента). Слайды
Лекция 3 (21 сентября). Линейные методы регрессии (метрики качества регрессии, регуляризация, методы оценивания обобщающей способности, кросс-валидация). Слайды
Лекция 4 (28 сентября). Линейные методы классификации (аппроксимация эмпирического риска, метрики качества в задачах классификации, персептрон). Слайды
Лекция 5 (5 октября). Линейные методы классификации (логистическая регрессия, метод опорных векторов, калибровка Платта). Слайды
Лекция 6 (12 октября). Многоклассовая классификация. Ядровые методы. Слайды
Лекция 7 (19 октября). Работа с признаками (методы отбора признаков, метод главных компонент и сингулярное разложение). Слайды
Лекция 8 (2 ноября). Решающие деревья. Слайды
Лекция 9 (9 ноября). Композиции алгоритмов (общая идея bias-variance decomposition, бэггинг, случайные леса). Слайды
Лекция 10 (16 ноября). Композиции алгоритмов (бустинг, градиентный бустинг над решающими деревьями). Слайды
Лекция 11 (23 ноября). Модификации градиентного бустинга над решающими деревьями. Методы кластеризации и визуализации данных. Слайды
Лекция 12 (30 ноября). Введение в нейронные сети (метод обратного распространения ошибки, полносвязные нейронные сети, свёрточные нейронные сети). Слайды
Лекция 13 (7 декабря). Работа с текстами (методы кодирования текстовых данных, word2vec, рекуррентные нейронные сети). Слайды
Лекция 14 (14 декабря). Прогнозирование временных рядов как задача регрессии: авторегрессия, тренды и сезонности. Адаптивные методы работы с временными рядами, фильтр Калмана. Слайды
Репозиторий на GitHub с конспектами лекций Евгения Соколова
Семинары
Семинар 1.
Полезные материалы
Книги
- Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.r, 2009.
- Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.
- Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. MIT Press, 2012.
- Murphy K. Machine Learning: A Probabilistic Perspective. MIT Press, 2012.
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Willi Richert, Luis Pedro Coelho. Building Machine Learning Systems with Python. Packt Publishing, 2013.