Машинное обучение (сов. бак. ВШЭ-РЭШ 2022) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 7: Строка 7:
 
'''Лектор:''' [https://www.hse.ru/org/persons/213369348 Михаил Гущин] (mhushchyn@hse.ru, @mikhail_h91)
 
'''Лектор:''' [https://www.hse.ru/org/persons/213369348 Михаил Гущин] (mhushchyn@hse.ru, @mikhail_h91)
  
'''Семинарист:''' Алексей Пономарев (@Lexolordan)
+
'''Семинаристы:''' Максим Карпов (@buntar29), Алексей Пономарев (@Lexolordan)
  
 
'''Ассистенты:''' Варвара Фурик (@grated_carrot), Кирилл Сафонов (@krsafonov)
 
'''Ассистенты:''' Варвара Фурик (@grated_carrot), Кирилл Сафонов (@krsafonov)
Строка 13: Строка 13:
 
Лекции проходят по вторникам в 16:20 (R205).
 
Лекции проходят по вторникам в 16:20 (R205).
  
Семинары проходят по вторникам в 18:10 (D511) и по средам в 16:20 (R307).
+
Семинары проходят по вторникам в 18:10 (D510) и по средам в 16:20 (R307).
  
 
[https://www.hse.ru/edu/courses/339942759 Карточка курса и программа.]
 
[https://www.hse.ru/edu/courses/339942759 Карточка курса и программа.]

Версия 12:49, 1 ноября 2022

О курсе

Курс читается для студентов 3 курса совместного бакалавриата ВШЭ-РЭШ в 1-2 модулях.

Проводится с 2019 года.

Лектор: Михаил Гущин (mhushchyn@hse.ru, @mikhail_h91)

Семинаристы: Максим Карпов (@buntar29), Алексей Пономарев (@Lexolordan)

Ассистенты: Варвара Фурик (@grated_carrot), Кирилл Сафонов (@krsafonov)

Лекции проходят по вторникам в 16:20 (R205).

Семинары проходят по вторникам в 18:10 (D510) и по средам в 16:20 (R307).

Карточка курса и программа.

Репозиторий с материалами курса на GitHub.

Чат в телеграме


Правила выставления оценок

В курсе предусмотрено несколько форм контроля знаний:

  • Практические домашние работы на Python или с теоретическими задачами (всего 6-8 домашних работ)
  • Контрольная работа в середине курса
  • Письменный экзамен

Бонусные баллы в курсе не предусмотрены (за исключением, может быть, участия в соревновании в четвертом модуле)

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = Округление(0.4 * ДЗ + 0.3 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

КР — оценка за контрольную работу

Э — оценка за экзамен

Округление арифметическое.

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Экзамен

Содержание работы: теоретические вопросы из списка (возможны измененные формулировки) + теоретические задачи. Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.

Рекомендации по написанию экзамена: Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.

Контрольная работа

Рекомендации по написанию контрольной работы: Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.


Лекции

Лекция 1. Введение в машинное обучение. [Слайды]

Лекция 2. Линейная регрессия. [Слайды] [Конспект 1 (стр. 1-10)] [Конспект 2 (стр. 1-5)]

Лекция 3. Линейная классификация. [Слайды]

Лекция 4. Метрики качества классификации. [Слайды]

Лекция 5. Метрические методы. Мультиклассовая классификация. [Слайды]

Лекция 6. Решающие деревья. [Слайды]

Лекция 7. Композиции алгоритмов. [Слайды]

Лекция 8. Отбор признаков. [Слайды]


Семинары

Семинар 1. Введение в машинное обучение. [Тетрадка] [Colab]

Семинар 2. Линейная регрессия. [Тетрадка 1] [Colab 1] [Тетрадка 2] [Colab 2]

Семинар 3. Линейная классификация. [Тетрадка] [Colab]

Семинар 4. Метрики качества классификации. [Тетрадка] [Colab]

Семинар 5. Метрические методы. Мультиклассовая классификация. [Тетрадка] [Colab]

Семинар 6. Решающие деревья. [Тетрадка] [Colab]

Семинар 7. Композиции алгоритмов. [Тетрадка] [Colab]

Семинар 8. Отбор признаков. [Тетрадка] [Colab]


Практические задания

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.

Задание 1. Введение в машинное обучение

Вам предстоит решить несколько задач на применение библиотек numpy и matplotlob, а также написать свою линейную регрессию.

Мягкий дедлайн: 13 октября 2022 года 23:59

Дедлайн: 16 октября 2022 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2022/homeworks/homework_1.ipynb

Задание 2. Логистическая регрессия

Вам предстоит реализовать алгоритм логистической регрессии и освоить работу с категориальными признаками.

Мягкий дедлайн: 10 ноября 2022 года 23:59

Дедлайн: 13 ноября 2022 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2022/homeworks/homework_2.ipynb

Бонусное задание 1. Введение в решающие деревья.

Вам предстоит реализовать разбиение элементов выборки в вершине дерева.

Мягкий дедлайн: 19 ноября 2022 года 23:59

Дедлайн: 19 ноября 2022 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2022/homeworks/bonus_homework_1%20.ipynb

Дополнительные материалы

Курсы по машинному обучению и анализу данных

Книги

  • Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.
  • Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.

Страница прошлого года