Машинное обучение (сов. бак. ВШЭ-РЭШ 2020) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 94: Строка 94:
 
== Контрольная работа ==
 
== Контрольная работа ==
  
Вопросы для подготовки (прошлого года, в этом году могут немного измениться): https://github.com/nadiinchi/ml_hse_nes_2019/blob/master/materials/midterm_questions.pdf
+
[https://github.com/nadiinchi/ml_hse_nes_2019/blob/master/materials/midterm_questions.pdf Вопросы для подготовки в прошлом году]
 
+
 
Контрольная работа включает теоретические вопросы и теоретические задачи, не включает задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
 
Контрольная работа включает теоретические вопросы и теоретические задачи, не включает задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
  
Строка 101: Строка 100:
 
Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.
 
Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.
  
[[https://github.com/nadiinchi/ml_hse_nes_2019/blob/master/materials/%D0%9F%D1%80%D0%B8%D0%BC%D0%B5%D1%80%20%D1%8D%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%B2%D0%B0%D1%80%D0%B8%D0%B0%D0%BD%D1%82%D0%B0.pdf Пример варианта]]
+
[https://github.com/nadiinchi/ml_hse_nes_2019/blob/master/materials/%D0%9F%D1%80%D0%B8%D0%BC%D0%B5%D1%80%20%D1%8D%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%B2%D0%B0%D1%80%D0%B8%D0%B0%D0%BD%D1%82%D0%B0.pdf Пример варианта]
  
 
Примеры задач:
 
Примеры задач:
* Метрические методы, kNN [[http://nbviewer.jupyter.org/github/shestakoff/minor_da_2017/blob/master/colloc_knn.ipynb Примеры задач]]
+
* [http://nbviewer.jupyter.org/github/shestakoff/minor_da_2017/blob/master/colloc_knn.ipynb Метрические методы,  kNN]
* Линейные методы [[https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_linear.pdf Примеры задач]]
+
* [https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_linear.pdf Линейные методы]
* Решающие деревья [[https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_trees.ipynb Примеры задач]]
+
* [https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_trees.ipynb Решающие деревья]
* Метрики качества [[https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_metrics.ipynb Примеры задач]]
+
* [https://github.com/esokolov/ml-minor-hse/blob/master/colloquium-2017/colloquium_minor_problems_metrics.ipynb Метрики качества]
  
 
== Экзамен ==
 
== Экзамен ==
  
(Формат такой же, как у КР, но по всему курсу)
+
Формат такой же, как у КР, но по всему курсу.
  
 
== Соревнования ==
 
== Соревнования ==
  
 
В конце курса, возможно, будет организовано соревнование на бонусные баллы.
 
В конце курса, возможно, будет организовано соревнование на бонусные баллы.
 
==Страница прошлого года==
 
 
https://github.com/nadiinchi/ml_hse_nes_2019
 
  
 
==Полезные материалы==
 
==Полезные материалы==
 +
[https://github.com/nadiinchi/ml_hse_nes_2019 Страница прошлого года]
 
===Курсы по машинному обучению и анализу данных===
 
===Курсы по машинному обучению и анализу данных===
 
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]
 
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]

Версия 08:29, 25 сентября 2020

О курсе

Курс читается для студентов 3-4 курса совместного бакалавриата ВШЭ-РЭШ в 1-2 модулях.

Проводится с 2019 года.

Лектор: Надежда Чиркова (nchirkova@hse.ru, @nadiinch)

Семинарист: Анастасия Карпова (@Asya_Karpova)

Ассистент: Сайдаш Мифтахов (@saydashtatar)

Лекции проходят по пятницам в 13:00 (Покровский бульвар, 11, в сентябре онлайн).

Семинары проходят по средам в 9:30 (Покровский бульвар, 11, в сентябре онлайн).

Чат в телеграме


Правила выставления оценок

В курсе предусмотрено несколько форм контроля знаний:

  • Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров (всего 4-5 проверочных)
  • Практические домашние работы на Python (всего 7-8 домашних работ)
  • Контрольная работа в середине курса
  • Письменный экзамен

Домашние работы будут иногда включать дополнительные задания, за которые начисляются бонусные баллы. Бонусные баллы можно прибавить к ДЗ и ПР (до достижения 10), но нельзя прибавлять к КР и экзамену. Бонусные баллы учитываются при вычислении порогов для автомата (см. ниже).

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = Округление(0.4 * ДЗ + 0.1 * ПР + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

ПР — средняя оценка за письменные проверочные работы на семинарах

КР — оценка за контрольную работу

Э — оценка за экзамен

Округление арифметическое.

Информация об автоматах будет объявлена в середине второго модуля. В прошлом году автомат выставлялся при преодолении двух порогов: на оценку за КР и за экзамен (в этом случае автоматом выставлялась оценка, полученная по формуле 4/7 * ДЗ + 1/7 * ПР + 2/7 * КР - перенормированная формула общей оценки курса).

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Лекция 1. Введение в машинное обучение. [Презентация по введению.] [Презентация про данные.]

Лекции 2-3. Линейная регрессия. [Конспект 1 (стр. 1-10)] [Конспект 2 (стр. 1-5)]

План курса:

  • Введение в машинное обучение (постановки задач, виды данных, метрики качества)
  • Обучение с учителем (задачи регрессии и классификации, классические методы их решения: линейные модели, метрические методы, решающие деревья, композицци алгоритмов; обзор задачи построения рекомендательных систем)
  • Обучение без учителя (задачи кластеризации, визуализации, понижения размерности, обзоры методов их решения)
  • Глубинное обучение (понятие вычислительного графа, основные виды слоев и архитектур нейронных сетей, приемы для обучения нейронных сетей)

Семинары

На семинарах будут разбираться теоретические задачи и практические задания. Практика в курсе проводится с использованием языка Python и библиотек Numpy, Pandas, Sklearn, Matplotlib, PyTorch.

Семинар 1. Повторение Python и Numpy

Семинар 2. Таблички-картиночки

Семинар 3. Дифференцирование по вектору и неправильный вывод оценки для ridge-регрессии 👒

Конспект с подвохом

Компьютерные заметки

Семинар 4. Правильный вывод оценки для ridge-регрессии 👒 Нормализация данных. Кросс-валидация.

Заметки c семинара

Домашние задания

Домашняя работа 1. Задачки в Numpy. Линейная регрессия

Контрольная работа

Вопросы для подготовки в прошлом году Контрольная работа включает теоретические вопросы и теоретические задачи, не включает задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.

Рекомендации по написанию контрольной работы: Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.

Пример варианта

Примеры задач:

Экзамен

Формат такой же, как у КР, но по всему курсу.

Соревнования

В конце курса, возможно, будет организовано соревнование на бонусные баллы.

Полезные материалы

Страница прошлого года

Курсы по машинному обучению и анализу данных

Статьи

Книги

  • Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
  • Boris Mirkin. Core Concepts in Data Analysis: Summarization, Correlation, Visualization. 2010.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. 2013.