Машинное обучение (сов. бак. ВШЭ-РЭШ 2023) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показано 47 промежуточных версии 3 участников)
Строка 8: Строка 8:
  
 
[https://t.me/+NyuAxz-2HFsyM2My Чат в телеграме]
 
[https://t.me/+NyuAxz-2HFsyM2My Чат в телеграме]
 +
 +
[https://forms.gle/JjUw8oEVxDukhPEF8 Анонимная форма обратной связи]
  
 
=== Лекции ===
 
=== Лекции ===
Строка 23: Строка 25:
 
| МО-1 || [https://t.me/Vovvy Владимир Бочарников] || [https://t.me/s_pirogova Софья Пирогова]|| [https://t.me/+qgjzy_kRhIU1Zjcy Чат] || R506 || среда, 14:40
 
| МО-1 || [https://t.me/Vovvy Владимир Бочарников] || [https://t.me/s_pirogova Софья Пирогова]|| [https://t.me/+qgjzy_kRhIU1Zjcy Чат] || R506 || среда, 14:40
 
|-  
 
|-  
| МО-2 || [https://t.me/fedya_dmitriev Сергей Корпачев] || [https://t.me/metraats Артём Станкевич]|| [https://t.me/+5s28KFwIWMpmNGFi Чат] || - || суббота, 14:40
+
| МО-2 || [https://t.me/fedya_dmitriev Сергей Корпачев] || [https://t.me/metraats Артём Станкевич]|| [https://t.me/+5s28KFwIWMpmNGFi Чат] || R308 || суббота, 14:40
 
|-
 
|-
 
|}
 
|}
Строка 45: Строка 47:
  
 
Округление арифметическое.
 
Округление арифметическое.
 +
 +
=== Правила выставления автомата ===
 +
 +
Условие выставления автомата: (ДЗ >=6 and КР >= 6)
 +
 +
В случае автомата итоговая оценка считается так:
 +
 +
O<sub>итоговая</sub> = Округление((0.5 * ДЗ + 0.2 * КР) / 0.7)
  
 
=== Правила сдачи заданий ===
 
=== Правила сдачи заданий ===
Строка 53: Строка 63:
  
 
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
 
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
 
  
 
== Лекции ==
 
== Лекции ==
  
'''Лекция 1.''' Введение в машинное обучение.
+
'''Лекция 1.''' Введение в машинное обучение. KNN. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture01-intro-knn.pdf Слайды]]
  
 +
'''Лекция 2.''' Линейная регрессия. Градиентный спуск. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture02-linreg.pdf Слайды]]
 +
 +
'''Лекция 3.''' Линейная классификация. Логистическая регрессия. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture03-logreg.pdf Слайды]]
 +
 +
'''Лекция 4.''' Метрики качества. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture04-metrics.pdf Слайды]]
 +
 +
'''Лекция 5.''' Решающие деревья. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture05-trees.pdf Слайды]]
 +
 +
'''Лекция 6.''' Композиции алгоритмов. Случайный лес. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture06-bagging.pdf Слайды]]
 +
 +
'''Лекция 7.''' Градиентный бустинг. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture07-boosting.pdf Слайды]]
 +
 +
'''Лекция 8.''' Категориальные признаки. Анализ текстов. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture08-texts.pdf Слайды]]
 +
 +
'''Лекция 9.''' Отбор признаков. Уменьшение размерности. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture09-features.pdf Слайды]]
 +
 +
'''Лекция 10.''' Кластеризация. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture10-clustering.pdf Слайды]]
 +
 +
'''Лекция 11.''' Нейронные сети. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture11-networks.pdf Слайды]]
 +
 +
'''Лекция 12.''' Анализ изображений. Сверточные нейронные сети. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture12-nn.pdf Слайды]]
 +
 +
'''Лекция 13.''' Рекомендательные системы. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/lectures/lecture13-recsys.pdf Слайды]]
  
 
== Семинары ==
 
== Семинары ==
  
'''Семинар 1.''' Введение в машинное обучение.
+
'''Семинар 1.''' Введение в машинное обучение. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar01/numpy_and_sklearn_basics.ipynb Тетрадка]] [[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar01/numpy_and_sklearn_basics.ipynb Colab]]
  
 +
'''Семинар 2.''' Линейная регрессия. Градиентный спуск. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar02/seminar.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar02/seminar.ipynb Colab]]
 +
 +
'''Семинар 3.''' Линейная классификация. Логистическая регрессия. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar03/sem03_logreg.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar03/sem03_logreg.ipynb Colab]]
 +
 +
'''Семинар 4.''' Метрики качества. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar04/seminar04_quality.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar04/seminar04_quality.ipynb Colab]]
 +
 +
'''Семинар 5.''' Решающие деревья. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar05/sem05_trees.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar05/sem05_trees.ipynb Colab]]
 +
 +
'''Семинар 6.''' Ансамбли деревьев. Случайный лес. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar06/sem06_rf.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar06/sem06_rf.ipynb Colab]]
 +
 +
'''Семинар 7.''' Градиентный бустинг. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar07/sem07_boosting.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar07/sem07_boosting.ipynb Colab]]
 +
 +
'''Семинар 8.''' Введение в анализ текстов. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar08/seminar8_nlp.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar08/seminar8_nlp.ipynb Colab]]
 +
 +
'''Семинар 9.''' Отбор признаков. Уменьшение размерности. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar09/sem09_features_pca.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar09/sem09_features_pca.ipynb Colab]]
 +
 +
'''Семинар 10.''' Кластеризация. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar10/sem10_clustering.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar10/sem10_clustering.ipynb Colab]]
 +
 +
'''Семинар 11.''' Нейронные сети. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar11/sem11_pytorch.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar11/sem11_pytorch.ipynb Colab]]
 +
 +
'''Семинар 12.''' Анализ изображений. Сверточные нейронные сети. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar12/sem12_cnn.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar12/sem12_cnn.ipynb Colab]]
 +
 +
'''Семинар 13.''' Рекомендательные системы. [[https://github.com/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar13/sem13_recsys.ipynb Тетрадка]]
 +
[[https://colab.research.google.com/github/hse-ds/ml-hse-nes/blob/main/2023/seminars/seminar13/sem13_recsys.ipynb Colab]]
  
 
== Практические задания ==
 
== Практические задания ==
Строка 69: Строка 136:
 
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.
 
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.
  
 +
===Задание 1. Введение в машинное обучение ===
 +
Вам предстоит решить несколько задач на применение библиотек numpy и matplotlob, а также написать свою линейную регрессию.
 +
 +
'''Мягкий дедлайн''':  25 сентября 2023 года 23:59
 +
 +
'''Дедлайн''':  28 сентября 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_1.ipynb
 +
 +
===Задание 2. Линейная регрессия. Градиентный спуск. ===
 +
Вам предстоит решить несколько теоретических задач по производным, линейной алгебре, градиентному спуску и линейной регрессии.
 +
 +
'''Мягкий дедлайн''':  02 октября 2023 года 23:59
 +
 +
'''Дедлайн''':  05 октября 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_2.pdf
 +
 +
===Задание 3. Логистическая регрессия ===
 +
Вам предстоит решить несколько задач на реализацию метода логистической регрессии и оценки качества классификации.
 +
 +
'''Мягкий дедлайн''':  16 октября 2023 года 23:59
 +
 +
'''Дедлайн''':  19 октября 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_3.ipynb
 +
 +
===Задание 4. Решающие деревья ===
 +
Вам предстоит реализовать разбиение элементов выборки в вершине дерева.
 +
 +
'''Мягкий дедлайн''':  30 октября 2023 года 23:59
 +
 +
'''Дедлайн''':  02 ноября 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_4.ipynb
 +
 +
===Задание 5. Композиции алгоритмов ===
 +
В этом задании вам нужно решить несколько задач по ансамблям моделей.
 +
 +
'''Мягкий дедлайн''':  06 ноября 2023 года 23:59
 +
 +
'''Дедлайн''':  09 ноября 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_5.pdf
 +
 +
===Задание 6. Бустинг ===
 +
Вам предстоит реализовать упрощенный вариант градиентного бутсинга для задачи регрессии.
 +
 +
'''Мягкий дедлайн''':  20 ноября 2023 года 23:59
 +
 +
'''Дедлайн''':  23 ноября 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_6.ipynb
 +
 +
===Задание 7. Категориальные признаки ===
 +
Вам предстоит освоить работу с категориальными признаками.
 +
 +
'''Мягкий дедлайн''':  01 декабря 2023 года 23:59
 +
 +
'''Дедлайн''':  04 декабря 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_7.ipynb
 +
 +
===Задание 8. Отбор признаков и метод главных компонент ===
 +
Вам предстоит выполнить несколько заданий по отбору признаков и  уменьшению размерности.
 +
 +
'''Мягкий дедлайн''':  11 декабря 2023 года 23:59
 +
 +
'''Дедлайн''':  14 декабря 2023 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_8.ipynb
  
 
== Контрольная работа ==
 
== Контрольная работа ==
  
[[https://drive.google.com/file/d/1XSuR3bAh9ve33KZXtrGlp7q4jyN9CxT4/view?usp=sharing Вопросы к контрольной работе (мидтерму) 2022)]]
+
[[https://disk.yandex.ru/i/KBgVZXLEsOW2JQ Вопросы и задачи к контрольной работе (мидтерму) 2023)]]
  
Порядок проведения контрольной работы и экзамена:
+
'''Дата проведения:''' 14 ноября 2023 г. на лекции.
 +
 
 +
Порядок проведения контрольной работы:
  
 
1) При написании работы пользоваться ничем нельзя (closed-book)
 
1) При написании работы пользоваться ничем нельзя (closed-book)
  
2) Каждый студент должен в начале своей работы от руки написать следующую фразу:
+
2) Каждый студент должен в начале своей работы от руки написать свои ФИО.
"Настоящим подтверждаю, что я, Ф.И.О., внимательно изучил и понял все требования к данной контрольной работе и готов их выполнить. Подпись, расшифровка, число". Работы без данной подписи приниматься не будут.
+
  
 
Время написания работы: 1 час 20 минут.
 
Время написания работы: 1 час 20 минут.
Строка 85: Строка 224:
 
Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.
 
Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.
  
Содержание работы: теоретические вопросы из списка (возможны измененные формулировки). Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
+
Содержание работы: 8 вопросов и 2 задачи из списка (возможны измененные формулировки). Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
  
 
Рекомендации по написанию контрольной работы:
 
Рекомендации по написанию контрольной работы:
Строка 93: Строка 232:
 
==Экзамен==
 
==Экзамен==
  
[[https://docs.google.com/document/d/1kAQxRWS07-b4qgHEhuxcM7tDjRaLkrydjFWCyBKUGXQ/edit?usp=sharing Вопросы к экзамену 2022]]
+
[[https://disk.yandex.ru/i/5TcDX-PaWy8V2A Вопросы к экзамену 2023]]
  
Порядок проведения контрольной работы и экзамена:
+
'''Дата проведения:''' 19 декабря 2023 г. на лекции.
 +
 
 +
Порядок проведения контрольной работы:
  
 
1) При написании работы пользоваться ничем нельзя (closed-book)
 
1) При написании работы пользоваться ничем нельзя (closed-book)
  
2) Каждый студент должен в начале своей работы от руки написать свои Ф.И.О. и группу.
+
2) Каждый студент должен в начале своей работы от руки написать свои ФИО.
  
 
Время написания работы: 1 час 20 минут.
 
Время написания работы: 1 час 20 минут.
Строка 105: Строка 246:
 
Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.
 
Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.
  
Содержание работы: теоретические вопросы из списка (возможны измененные формулировки). Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
+
Содержание работы: 10 вопросов из списка (возможны измененные формулировки). Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.
  
Рекомендации по написанию экзамена:
+
Рекомендации по написанию контрольной работы:
 
Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.
 
Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.
  
Строка 114: Строка 255:
  
 
===Курсы по машинному обучению и анализу данных===
 
===Курсы по машинному обучению и анализу данных===
* [https://openedu.ru/course/hse/INTRML/ Курс на платформе "Открытое образование"]
+
* [https://academy.yandex.ru/handbook/ml Онлайн-учебник по машинному обучению от ШАД]
 
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]
 
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]
* [https://yandexdataschool.ru/edu-process/courses/machine-learning Видеозаписи лекций курса Школы Анализа Данных, К.В. Воронцов]
+
* [https://openedu.ru/course/hse/INTRML/ Курс на платформе "Открытое образование"]
* https://barangkaliada.blogspot.com
+
* https://www.facebook.com/flx/warn/?u=barangkaliada
+
* https://youtu.be/embed/NT61JPohS9I
+
* http://www.google.li/url?q=https://barangkaliada.blogspot.com
+
  
 
===Книги===
 
===Книги===
* Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.
+
* [https://link.springer.com/book/10.1007/978-0-387-84858-7 Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009]
* Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.
+
* [http://lcsl.mit.edu/courses/ml/1718/MLNotes.pdf Rosasco L., Introductory Machine Learning Notes, 2017]
 +
* [https://www.microsoft.com/en-us/research/uploads/prod/2006/01/Bishop-Pattern-Recognition-and-Machine-Learning-2006.pdf Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006]
  
 
===Страницы прошлых лет===
 
===Страницы прошлых лет===

Текущая версия на 11:18, 13 декабря 2023

О курсе

Курс читается для студентов 2-4 курсов совместного бакалавриата ВШЭ-РЭШ в 1-2 модулях.

Карточка курса и программа. (TODO: Обновить)

Репозиторий с материалами курса на GitHub.

Чат в телеграме

Анонимная форма обратной связи

Лекции

Лектор: Михаил Гущин (mhushchyn@hse.ru, @mikhail_h91)

Лекции проходят по вторникам в 16:20 (R205).

Семинары

Группа Преподаватель Учебный ассистент Ссылка на чат Аудитория Время
МО-1 Владимир Бочарников Софья Пирогова Чат R506 среда, 14:40
МО-2 Сергей Корпачев Артём Станкевич Чат R308 суббота, 14:40

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знаний:

  • Практические домашние работы на Python или с теоретическими задачами (всего 6-8 домашних работ)
  • Контрольная работа в середине курса
  • Письменный экзамен

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

КР — оценка за контрольную работу

Э — оценка за экзамен

Округление арифметическое.

Правила выставления автомата

Условие выставления автомата: (ДЗ >=6 and КР >= 6)

В случае автомата итоговая оценка считается так:

Oитоговая = Округление((0.5 * ДЗ + 0.2 * КР) / 0.7)

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Лекция 1. Введение в машинное обучение. KNN. [Слайды]

Лекция 2. Линейная регрессия. Градиентный спуск. [Слайды]

Лекция 3. Линейная классификация. Логистическая регрессия. [Слайды]

Лекция 4. Метрики качества. [Слайды]

Лекция 5. Решающие деревья. [Слайды]

Лекция 6. Композиции алгоритмов. Случайный лес. [Слайды]

Лекция 7. Градиентный бустинг. [Слайды]

Лекция 8. Категориальные признаки. Анализ текстов. [Слайды]

Лекция 9. Отбор признаков. Уменьшение размерности. [Слайды]

Лекция 10. Кластеризация. [Слайды]

Лекция 11. Нейронные сети. [Слайды]

Лекция 12. Анализ изображений. Сверточные нейронные сети. [Слайды]

Лекция 13. Рекомендательные системы. [Слайды]

Семинары

Семинар 1. Введение в машинное обучение. [Тетрадка] [Colab]

Семинар 2. Линейная регрессия. Градиентный спуск. [Тетрадка] [Colab]

Семинар 3. Линейная классификация. Логистическая регрессия. [Тетрадка] [Colab]

Семинар 4. Метрики качества. [Тетрадка] [Colab]

Семинар 5. Решающие деревья. [Тетрадка] [Colab]

Семинар 6. Ансамбли деревьев. Случайный лес. [Тетрадка] [Colab]

Семинар 7. Градиентный бустинг. [Тетрадка] [Colab]

Семинар 8. Введение в анализ текстов. [Тетрадка] [Colab]

Семинар 9. Отбор признаков. Уменьшение размерности. [Тетрадка] [Colab]

Семинар 10. Кластеризация. [Тетрадка] [Colab]

Семинар 11. Нейронные сети. [Тетрадка] [Colab]

Семинар 12. Анализ изображений. Сверточные нейронные сети. [Тетрадка] [Colab]

Семинар 13. Рекомендательные системы. [Тетрадка] [Colab]

Практические задания

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.

Задание 1. Введение в машинное обучение

Вам предстоит решить несколько задач на применение библиотек numpy и matplotlob, а также написать свою линейную регрессию.

Мягкий дедлайн: 25 сентября 2023 года 23:59

Дедлайн: 28 сентября 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_1.ipynb

Задание 2. Линейная регрессия. Градиентный спуск.

Вам предстоит решить несколько теоретических задач по производным, линейной алгебре, градиентному спуску и линейной регрессии.

Мягкий дедлайн: 02 октября 2023 года 23:59

Дедлайн: 05 октября 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_2.pdf

Задание 3. Логистическая регрессия

Вам предстоит решить несколько задач на реализацию метода логистической регрессии и оценки качества классификации.

Мягкий дедлайн: 16 октября 2023 года 23:59

Дедлайн: 19 октября 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_3.ipynb

Задание 4. Решающие деревья

Вам предстоит реализовать разбиение элементов выборки в вершине дерева.

Мягкий дедлайн: 30 октября 2023 года 23:59

Дедлайн: 02 ноября 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_4.ipynb

Задание 5. Композиции алгоритмов

В этом задании вам нужно решить несколько задач по ансамблям моделей.

Мягкий дедлайн: 06 ноября 2023 года 23:59

Дедлайн: 09 ноября 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_5.pdf

Задание 6. Бустинг

Вам предстоит реализовать упрощенный вариант градиентного бутсинга для задачи регрессии.

Мягкий дедлайн: 20 ноября 2023 года 23:59

Дедлайн: 23 ноября 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_6.ipynb

Задание 7. Категориальные признаки

Вам предстоит освоить работу с категориальными признаками.

Мягкий дедлайн: 01 декабря 2023 года 23:59

Дедлайн: 04 декабря 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_7.ipynb

Задание 8. Отбор признаков и метод главных компонент

Вам предстоит выполнить несколько заданий по отбору признаков и уменьшению размерности.

Мягкий дедлайн: 11 декабря 2023 года 23:59

Дедлайн: 14 декабря 2023 года 23:59

Ссылка: https://github.com/hse-ds/ml-hse-nes/blob/main/2023/homeworks/homework_8.ipynb

Контрольная работа

[Вопросы и задачи к контрольной работе (мидтерму) 2023)]

Дата проведения: 14 ноября 2023 г. на лекции.

Порядок проведения контрольной работы:

1) При написании работы пользоваться ничем нельзя (closed-book)

2) Каждый студент должен в начале своей работы от руки написать свои ФИО.

Время написания работы: 1 час 20 минут.

Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.

Содержание работы: 8 вопросов и 2 задачи из списка (возможны измененные формулировки). Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.

Рекомендации по написанию контрольной работы: Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.


Экзамен

[Вопросы к экзамену 2023]

Дата проведения: 19 декабря 2023 г. на лекции.

Порядок проведения контрольной работы:

1) При написании работы пользоваться ничем нельзя (closed-book)

2) Каждый студент должен в начале своей работы от руки написать свои ФИО.

Время написания работы: 1 час 20 минут.

Если прокторы во время проведения работы замечают противоправные или странные действия, за работу снимаются баллы. В случае обнаружения любого вида списывания работа сразу оценивается в 0 баллов.

Содержание работы: 10 вопросов из списка (возможны измененные формулировки). Контрольная работа и экзамен не включают задачи на программирование. Теоретические вопросы подразумевают развернутые ответы с формулами.

Рекомендации по написанию контрольной работы: Во всех формулах поясните обозначения. На всех графиках подпишите оси. Для всех рисунков поясните, что изображено на них. Во всех задачах оптимизации подпишите, по каким переменным она выполняется. Для всех суммирований подпишите индекс и границы суммирования.


Дополнительные материалы

Курсы по машинному обучению и анализу данных

Книги

Страницы прошлых лет

Страница курса 2022 года

Страница курса 2021 года

Страница курса 2020 года