Машинное обучение (сов. бак. ВШЭ-РЭШ 2021)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 3-4 курса совместного бакалавриата ВШЭ-РЭШ в 1-2 модулях.

Проводится с 2019 года.

Лектор: Надежда Чиркова (nchirkova@hse.ru, @nadiinchi)

Семинаристка: Анастасия Карпова (@Asya_Karpova)

Ассистенты: Александр Югай (@AleksandrY99), Екатерина Кострыкина (@ekostrykina)

Лекции проходят по пятницам в 13:00 (онлайн, см. чат).

Семинары проходят по средам в 9:30 (в классе, R503).

Чат в телеграме


Правила выставления оценок

В курсе предусмотрено несколько форм контроля знаний:

  • Самостоятельные работы на семинарах, проверяющие знание материала лекций и семинаров, могут включать теоретические задачи (всего 4-6 проверочных)
  • Практические домашние работы на Python или с теоретическими задачами (всего 6-8 домашних работ)
  • Контрольная работа в середине курса
  • Письменный экзамен

Бонусные баллы в курсе не предусмотрены (за исключением, может быть, участия в соревновании в четвертом модуле)

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = Округление(0.4 * ДЗ + 0.1 * ПР + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

ПР — средняя оценка за письменные проверочные работы на семинарах

КР — оценка за контрольную работу

Э — оценка за экзамен

Округление арифметическое.

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Контрольная работа

[Вопросы к контрольной работе (мидтерму) 2021)]

Порядок проведения контрольной работы и экзамена:

1) При написании работы пользоваться ничем нельзя (closed-book)

2) У студента должна быть включена камера все время проведения работы. Нужно будет установить камеру телефона так, чтобы вас было целиком видно (вы, стол, листок, на котором вы пишете). Именно целиком, а не часть вас и не часть листка. Звук не нужен. Проверьте, что у вас хорошее интернет-соединение. Будет вестись запись.

3) Вы открываете работу на компьютере в начале написания и больше не используете мышь/тачпад/клавитатуру и тд. Работа будет помещаться в один экран, отрегулируйте заранее настройки экрана, чтобы он не погас. Это очень важный пункт: нельзя использовать никакие средства ввода и вообще как-либо управлять компьютером или телефоном.

4) Каждый студент должен в начале своей работы от руки написать следующую фразу: "Настоящим подтверждаю, что я, Ф.И.О., внимательно изучил и понял все требования к данной контрольной работе и готов их выполнить. Подпись, расшифровка, число". Работы без данной подписи приниматься не будут.

Время написания работы: 1 час 20 минут.

Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.

Содержание работы: теоретические вопросы из списка (возможны измененные формулировки) + теоретические задачи. Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.

Лекции

Указаны прошлогодние материалы, при необходимости в течение курса они будут обновляться.

Тема 1. Введение в машинное обучение. [Презентация по введению.]

Тема 2. Линейная регрессия. [Конспект 1 (стр. 1-10)] [Конспект 2 (стр. 1-5)]

Тема 3. Линейная классификация. [Конспект 1 (стр. 1-3)] [Конспект 2 (стр. 1-4)]

Тема 4. Метрики качества классификации. [Конспект (стр. 3-8)]

Тема 5. (вошла в семинары) Многоклассовая линейная классификация. [Конспект по многоклассовой классификации (стр. 1-3, 5-6)]

Тема 6. (вошла в семинары) Метрические методы. [Конспект по метрическим методам (стр. 1-2)]

Тема 7. Решающие деревья [Конспект]

Тема 8. Композиции алгоритмов [Конспект про бэггинг и случайные леса (стр. 1, 2, 9)] [Конспект про градиентный бустинг (стр. 1-4)]

Тема 9. Отбор признаков [Презентация]

Тема 10. Кластеризация и методы понижения размерности [Конспект по кластеризации и визуализации] [Видео про метод главных компонент] [Вывод решения в методе главных компонент (доп. материал)]

Тема 11. Рекомендательные системы [Конспект (стр. 3-7)]

Тема 12. Введение в нейронные сети [Презентация] (на лекции было больше материала)

Тема 13. Сверточные нейросети. Регуляризация нейронных сетей. [Презентация] (на лекции было больше материала)

Тема 14. Нейронные сети в анализе текстов. [Презентация]

План курса:

  • Введение в машинное обучение (постановки задач, виды данных, метрики качества)
  • Обучение с учителем (задачи регрессии и классификации, классические методы их решения: линейные модели, метрические методы, решающие деревья, композицци алгоритмов; обзор задачи построения рекомендательных систем)
  • Обучение без учителя (задачи кластеризации, визуализации, понижения размерности, обзоры методов их решения)
  • Глубинное обучение (понятие вычислительного графа, основные виды слоев и архитектур нейронных сетей, приемы для обучения нейронных сетей)

Семинары

Github с семинарами и домашками.

На семинарах будут разбираться теоретические задачи, новый теоретический материал и практические задания. Практика в курсе проводится с использованием языка Python, среды Jupyter Notebook и библиотек Numpy, Pandas, Sklearn, Matplotlib, PyTorch.

Курсы по машинному обучению и анализу данных

Книги

  • Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.
  • Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.

Страница прошлого года