Машинное обучение (современные методы)-МОиВС-2021-2022
Содержание
[убрать]О курсе
Преподаватели:
Максимовская Анастасия Максимовна, Рысьмятова Анастасия Александровна
Семинары
Канал курса в Slack: https://machinelearninginhse.slack.com/archives/C02K94RG7RQ
Занятия проводятся в Zoom по средам:
Все материалы занятий находятся здесь: https://github.com/AnastasiyaMax/MLDS_ml_course_fall21
Ссылки на видеозаписи занятий
Записи занятий:
Расписание
Группа | Ссылка | Преподаватель | Учебный ассистент | Инвайт в anytask |
Среда 19:00 | Zoom | Анастасия Максимовская | Юлия Василевская | uwJwiEv |
Среда 19:30 | Zoom | Анастасия Рысьмятова | Савелий Прохоров | 5byEmS7 |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- 2 курса на платформе Coursera;
- самостоятельные работы на некоторых занятиях (пятиминутки);
- домашние задания (в том числе соревнование на Kaggle);
- экзамен в сессию третьего модуля (письменный).
Все работы оцениваются в 10 баллов.
Накопленная оценка вычисляется на основе оценки за работу в течение 2-х модулей:
Накопленная оценка = 0.5 * ДЗ + 0.3 * ПР + 0.2 * К, где ДЗ – средняя по всем Домашним заданиям, ПР – средняя по всем пятиминуткам, К – средняя по двум курсам на Coursera
Курс предполагает оценку автоматом:
-
если Накопленная оценка >= 8, то Итоговая оценка ставится по накопленной -
иначе, Итоговая оценка = 0.8 * Накопленная оценка + 0.2 * Экзамен - если экзамен не писался, оценка ставится по накопу;
- экзамен работает только на повышение оценки и идёт в итоговую оценку с весом 0.2:
Экзамен
Экзамен пройдёт 2 апреля (Сб) в 14:00. Для студентов, которые по объективным причинам не могут писать экзамен в основное время, резервное - 2 апреля (Сб) в 19:00.
Экзамен будет состоять из 3-х частей:
- Части A (тестовая с вариантами ответа) на 2.5 балла с 16-ю заданиями равного веса
- Части B (задачи без вариантов ответа) на 3.5 балла с 6-ю заданиями равного веса
- Части C (работа с набором данных) на 4 балла с заданиями индивидуального веса
Пройдет экзамен на платформе online.hse.ru, на его выполнение будет дано 120 мин. Пожалуйста, убедитесь, что вы подключены к курсу по этой ссылке: https://online.hse.ru/course/view.php?id=4861
Во время написания экзамена можно пользоваться всеми материалами курса, а также средой программирования на Python (рекомендуем подготовить её перед экзаменом, чтобы не терять время).
Задания 1-4 (1.75 первичных балла суммарно) внутри части C будут целиком на pandas, для выполнения заданий 5-6 необходимо будет воспользоваться библиотекой scikit-learn. В последнем задании (на построение собственной модели) грейдер не работает: ничего, загружайте ваши предсказания, а мы оценим вручную
Семинары
Материалы семинаров: GitHub
Плейлисты с записями:
семинар 1, 27.10.2021 – Основные понятия в машинном обучении
семинар 2, 03.11.2021 – Метод K ближайших соседей: запуск с помощью sklearn, реализация, особенности и проблемы метода
семинар 3, 10.11.2021 – Линейная регрессия, аналитический вывод весов, регуляризация, метрики качества для регрессии
семинар 4, 17.11.2021 – Линейная регрессия и градиентное обучение
семинар 5, 24.11.2021 – Модификации градиентного спуска, обнуление весов L1 регуляризацией, линейная классификация
семинар 6, 01.12.2021 – Метрики качества в задаче бинарной классификации
семинар 7, 08.12.2021 – Логистическая регрессия и метод опорных векторов
семинар 8, 15.12.2021 – Предобработка данных, классификация текстов.
семинар 9, 22.12.2021 – Многоклассовая классификация + метрики качества, классификация с пересекающимися классами + метрики качества
семинар 10, 12.01.2022 – Решающие деревья и случайный лес
семинар 11, 26.01.2022 – Разложение ошибки на смещение и разброс, беггинг
семинар 12, 02.02.2022 – Бустинг в задаче регрессии, градиентный бустинг
семинар 13, 09.02.2022 – Имплементации градиентного бустинга, теория
семинар 14, 16.02.2022 – Имплементации градиентного бустинга, практика
семинар 15, 02.03.2022 – Обзор основных метрик и моделей кластеризации
семинар 16, 09.03.2022 – Снижение размерности
Домашние задания
Все домашние работы, а также пятиминутки необходимо сдавать в Anytask.
Инвайты:
- Группа 1 (преподаватель А. Максимовская): uwJwiEv
- Группа 2 (преподаватель А. Рысьмятова): 5byEmS7
ДЗ-1: Изучение библиотеки Pandas
ДЗ-2: Метод k ближайших соседей. Линейная регрессия, изучение библиотеки sklearn
ДЗ-3: Градиентные методы обучения
ДЗ-4: Линейная классификация. Классификация текстов
ДЗ-5: Решающие деревья
ДЗ-6: Разложение ошибки на смещение и разброс
ДЗ-7: Бустинги