Машинное обучение (сов. бак. ВШЭ-РЭШ 2021)
Содержание
О курсе
Курс читается для студентов 3-4 курса совместного бакалавриата ВШЭ-РЭШ в 1-2 модулях.
Проводится с 2019 года.
Лектор: Надежда Чиркова (nchirkova@hse.ru, @nadiinchi)
Семинаристка: Анастасия Карпова (@Asya_Karpova)
Ассистенты: Александр Югай (@AleksandrY99), Екатерина Кострыкина (@ekostrykina)
Лекции проходят по пятницам в 13:00 (онлайн, см. чат).
Семинары проходят по средам в 9:30 (в классе, R503).
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знаний:
- Самостоятельные работы на семинарах, проверяющие знание материала лекций и семинаров, могут включать теоретические задачи (всего 4-6 проверочных)
- Практические домашние работы на Python или с теоретическими задачами (всего 6-8 домашних работ)
- Контрольная работа в середине курса
- Письменный экзамен
Бонусные баллы в курсе не предусмотрены (за исключением, может быть, участия в соревновании в четвертом модуле)
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
Oитоговая = Округление(0.4 * ДЗ + 0.1 * ПР + 0.2 * КР + 0.3 * Э)
ДЗ — средняя оценка за практические домашние задания
ПР — средняя оценка за письменные проверочные работы на семинарах
КР — оценка за контрольную работу
Э — оценка за экзамен
Округление арифметическое.
Правила сдачи заданий
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Контрольная работа
[Вопросы к контрольной работе (мидтерму) 2021)]
Порядок проведения контрольной работы и экзамена:
1) При написании работы пользоваться ничем нельзя (closed-book)
2) У студента должна быть включена камера все время проведения работы. Нужно будет установить камеру телефона так, чтобы вас было целиком видно (вы, стол, листок, на котором вы пишете). Именно целиком, а не часть вас и не часть листка. Звук не нужен. Проверьте, что у вас хорошее интернет-соединение. Будет вестись запись.
3) Вы открываете работу на компьютере в начале написания и больше не используете мышь/тачпад/клавитатуру и тд. Работа будет помещаться в один экран, отрегулируйте заранее настройки экрана, чтобы он не погас. Это очень важный пункт: нельзя использовать никакие средства ввода и вообще как-либо управлять компьютером или телефоном.
4) Каждый студент должен в начале своей работы от руки написать следующую фразу: "Настоящим подтверждаю, что я, Ф.И.О., внимательно изучил и понял все требования к данной контрольной работе и готов их выполнить. Подпись, расшифровка, число". Работы без данной подписи приниматься не будут.
Время написания работы: 1 час 20 минут.
Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.
Содержание работы: теоретические вопросы из списка (возможны измененные формулировки) + теоретические задачи. Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
Лекции
Указаны прошлогодние материалы, при необходимости в течение курса они будут обновляться.
Тема 1. Введение в машинное обучение. [Презентация по введению.]
Тема 2. Линейная регрессия. [Конспект 1 (стр. 1-10)] [Конспект 2 (стр. 1-5)]
Тема 3. Линейная классификация. [Конспект 1 (стр. 1-3)] [Конспект 2 (стр. 1-4)]
Тема 4. Метрики качества классификации. [Конспект (стр. 3-8)]
Тема 5. (вошла в семинары) Многоклассовая линейная классификация. [Конспект по многоклассовой классификации (стр. 1-3, 5-6)]
Тема 6. (вошла в семинары) Метрические методы. [Конспект по метрическим методам (стр. 1-2)]
Тема 7. Решающие деревья [Конспект]
Тема 8. Композиции алгоритмов [Конспект про бэггинг и случайные леса (стр. 1, 2, 9)] [Конспект про градиентный бустинг (стр. 1-4)]
Тема 9. Отбор признаков [Презентация]
Тема 10. Кластеризация и методы понижения размерности [Конспект по кластеризации и визуализации] [Видео про метод главных компонент] [Вывод решения в методе главных компонент (доп. материал)]
Тема 11. Рекомендательные системы [Конспект (стр. 3-7)]
Тема 12. Введение в нейронные сети [Презентация] (на лекции было больше материала)
Тема 13. Сверточные нейросети. Регуляризация нейронных сетей. [Презентация] (на лекции было больше материала)
Тема 14. Нейронные сети в анализе текстов. [Презентация]
План курса:
- Введение в машинное обучение (постановки задач, виды данных, метрики качества)
- Обучение с учителем (задачи регрессии и классификации, классические методы их решения: линейные модели, метрические методы, решающие деревья, композицци алгоритмов; обзор задачи построения рекомендательных систем)
- Обучение без учителя (задачи кластеризации, визуализации, понижения размерности, обзоры методов их решения)
- Глубинное обучение (понятие вычислительного графа, основные виды слоев и архитектур нейронных сетей, приемы для обучения нейронных сетей)
Семинары
Github с семинарами и домашками.
На семинарах будут разбираться теоретические задачи, новый теоретический материал и практические задания. Практика в курсе проводится с использованием языка Python, среды Jupyter Notebook и библиотек Numpy, Pandas, Sklearn, Matplotlib, PyTorch.
Курсы по машинному обучению и анализу данных
- Курс на платформе "Открытое образование"
- Специализация на платформе Coursera
- Курс по машинному обучению К.В. Воронцова
- Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов
- Coursera: Machine Learning, Andrew Ng
Книги
- Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.
- Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.