Машинное обучение (современные методы)-МОиВС-2021-2022

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Преподаватели:

Максимовская Анастасия Максимовна, Рысьмятова Анастасия Александровна

Семинары

Канал курса в Slack: https://machinelearninginhse.slack.com/archives/C02K94RG7RQ

Занятия проводятся в Zoom по средам:

  • Подгруппа 1 (Анастасия Максимовская) - Zoom
  • Подгруппа 2 (Анастасия Рысьмятова) - Zoom

Все материалы занятий находятся здесь: https://github.com/AnastasiyaMax/MLDS_ml_course_fall21

Ссылки на видеозаписи занятий

Записи занятий:

Расписание

Группа Ссылка Преподаватель Учебный ассистент Инвайт в anytask
Среда 19:00 Zoom Анастасия Максимовская Юлия Василевская uwJwiEv
Среда 19:30 Zoom Анастасия Рысьмятова Савелий Прохоров 5byEmS7

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • 2 курса на платформе Coursera;
  • самостоятельные работы на некоторых занятиях (пятиминутки);
  • домашние задания (в том числе соревнование на Kaggle);
  • экзамен в сессию третьего модуля (письменный).

Все работы оцениваются в 10 баллов.


Накопленная оценка вычисляется на основе оценки за работу в течение 2-х модулей:

Накопленная оценка = 0.5 * ДЗ + 0.3 * ПР + 0.2 * К, где ДЗ – средняя по всем Домашним заданиям, ПР – средняя по всем пятиминуткам, К – средняя по двум курсам на Coursera

Курс предполагает оценку автоматом:

  • если Накопленная оценка >= 8, то Итоговая оценка ставится по накопленной
  • иначе, Итоговая оценка = 0.8 * Накопленная оценка + 0.2 * Экзамен
  • если экзамен не писался, оценка ставится по накопу;
  • экзамен работает только на повышение оценки и идёт в итоговую оценку с весом 0.2:

Экзамен

Экзамен пройдёт 2 апреля (Сб) в 14:00. Для студентов, которые по объективным причинам не могут писать экзамен в основное время, резервное - 2 апреля (Сб) в 19:00.

Экзамен будет состоять из 3-х частей:

  • Части A (тестовая с вариантами ответа) на 2.5 балла с 16-ю заданиями равного веса
  • Части B (задачи без вариантов ответа) на 3.5 балла с 6-ю заданиями равного веса
  • Части C (работа с набором данных) на 4 балла с заданиями индивидуального веса

Пройдет экзамен на платформе online.hse.ru, на его выполнение будет дано 120 мин. Пожалуйста, убедитесь, что вы подключены к курсу по этой ссылке: https://online.hse.ru/course/view.php?id=4861

Во время написания экзамена можно пользоваться всеми материалами курса, а также средой программирования на Python (рекомендуем подготовить её перед экзаменом, чтобы не терять время).

Задания 1-4 (1.75 первичных балла суммарно) внутри части C будут целиком на pandas, для выполнения заданий 5-6 необходимо будет воспользоваться библиотекой scikit-learn. В последнем задании (на построение собственной модели) грейдер не работает: ничего, загружайте ваши предсказания, а мы оценим вручную

Семинары

Материалы семинаров: GitHub

Плейлисты с записями:

семинар 1, 27.10.2021 – Основные понятия в машинном обучении

семинар 2, 03.11.2021 – Метод K ближайших соседей: запуск с помощью sklearn, реализация, особенности и проблемы метода

семинар 3, 10.11.2021 – Линейная регрессия, аналитический вывод весов, регуляризация, метрики качества для регрессии

семинар 4, 17.11.2021 – Линейная регрессия и градиентное обучение

семинар 5, 24.11.2021 – Модификации градиентного спуска, обнуление весов L1 регуляризацией, линейная классификация

семинар 6, 01.12.2021 – Метрики качества в задаче бинарной классификации

семинар 7, 08.12.2021 – Логистическая регрессия и метод опорных векторов

семинар 8, 15.12.2021 – Предобработка данных, классификация текстов.

семинар 9, 22.12.2021 – Многоклассовая классификация + метрики качества, классификация с пересекающимися классами + метрики качества

семинар 10, 12.01.2022 – Решающие деревья и случайный лес

семинар 11, 26.01.2022 – Разложение ошибки на смещение и разброс, беггинг

семинар 12, 02.02.2022 – Бустинг в задаче регрессии, градиентный бустинг

семинар 13, 09.02.2022 – Имплементации градиентного бустинга, теория

семинар 14, 16.02.2022 – Имплементации градиентного бустинга, практика

семинар 15, 02.03.2022 – Обзор основных метрик и моделей кластеризации

семинар 16, 09.03.2022 – Снижение размерности

Домашние задания

Все домашние работы, а также пятиминутки необходимо сдавать в Anytask.

Инвайты:

  • Группа 1 (преподаватель А. Максимовская): uwJwiEv
  • Группа 2 (преподаватель А. Рысьмятова): 5byEmS7

ДЗ-1: Изучение библиотеки Pandas

ДЗ-2: Метод k ближайших соседей. Линейная регрессия, изучение библиотеки sklearn

ДЗ-3: Градиентные методы обучения

ДЗ-4: Линейная классификация. Классификация текстов

ДЗ-5: Решающие деревья

ДЗ-6: Разложение ошибки на смещение и разброс

ДЗ-7: Бустинги