Машинное обучение (ФЭН) - 2022-2023 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 104: Строка 104:
  
 
== Семинары ==
 
== Семинары ==
Материалы семинаров: https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары
+
Материалы семинаров: https://github.com/Murcha1990/ML_Econom_2022-2023/tree/main/Семинары
  
Общий плейлист видео с семинаров и лекций: [https://www.youtube.com/playlist?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db YouTube]
+
'''Семинар 1.''' Основы регрессии. Градиентный спуск | [ссылка на семинар]
 
+
 
+
'''Семинар 1.''' Основы линейной алгебры и матричного дифференцирования | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%201 GitHub]
+
* [https://youtu.be/u39ejhACAZ4?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 07.09.2021)]
+
* [https://youtu.be/p1SMO3CvZVY?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 08.09.2021)]
+
 
+
'''Семинар 2.''' Линейная регрессия. Обучения и валидация качества модели | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%202 GitHub]
+
* [https://youtu.be/nGAQ0EpYehg?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 13.09.2021)]
+
* [https://youtu.be/S_fT6bFqqlg?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 14.09.2021)]
+
* [https://youtu.be/LXoZIWqpHlI?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 15.09.2021)]
+
 
+
'''Семинар 3.''' Вывод оптимальных констант некоторых функций потерь. Обсуждение предобработки данных | [https://github.com/Murcha1990/ML_Econom_2021-2022/blob/main/Семинары/Семинар%203/Seminar_3.ipynb GitHub]
+
* [https://youtu.be/99eArGD_dsA?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 20.09.2021)]
+
* [https://youtu.be/IVD1m1o7Nqc?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 21.09.2021)]
+
* [https://youtu.be/lMv5Ge3yiO8?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 22.09.2021)]
+
 
+
'''Семинар 4.''' Задача бинарной классификации, Подготовка данных. | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%204 GitHub]
+
* [https://youtu.be/C1eGH3VYKRA?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 27.09.2021)]
+
* [https://youtu.be/QUidNWC4e9U?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 28.09.2021)]
+
* [https://youtu.be/-1TC5mjn7uk?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 29.09.2021)]
+
 
+
'''Семинар 5.''' Решение задач классификации. Подбор гиперпараметров | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%205 GitHub]
+
* [https://youtu.be/W8d-h2yco4E?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 04.10.2021)]
+
* [https://youtu.be/QlyJUvEtslg?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 05.10.2021)]
+
* [https://youtu.be/KwLCh6tM9XI?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Пт, 08.10.2021)]
+
 
+
'''Семинар 6.''' Логистическая регрессия. SVM. AUC-ROC | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%206 GitHub]
+
* [https://youtu.be/y_44m-JoWQ0?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 11.10.2021)]
+
* [https://youtu.be/X7_Cegs_5x0?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 12.10.2021)]
+
* [https://youtu.be/8WV9TYO-5HU?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 13.10.2021)]
+
 
+
'''Семинар 7.''' Обсуждение feature extraction и feature selection | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%207 GitHub]
+
* [https://youtu.be/kVUmTAAHFpE?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 25.10.2021)]
+
* [https://youtu.be/84HwYIJ8aDU?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 26.10.2021)]
+
* [https://youtu.be/PnOBx0xABS0?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 27.10.2021)]
+
 
+
'''Семинар 8.''' Решающие деревья | [https://github.com/Murcha1990/ML_Econom_2021-2022/blob/main/Семинары/Семинар%208/Seminar8.ipynb GitHub]
+
* [https://youtu.be/JPv1IVmJlNk?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 01.11.2021)]
+
* [https://youtu.be/OyJcXAyoz6k?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 02.11.2021)]
+
* [https://youtu.be/y6SwYYKFlrg?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 03.11.2021)]
+
 
+
'''Семинар 9.''' Случайный лес и компромисс между смещением и разбросом | [https://github.com/Murcha1990/ML_Econom_2021-2022/blob/main/Семинары/Семинар%209/Seminar9.ipynb GitHub]
+
* [https://youtu.be/F1riceCh8iw?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 08.11.2021)]
+
* [https://youtu.be/AuB1pXtslaU?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 09.11.2021)]
+
* [https://youtu.be/Q4MNUWxS064?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 10.11.2021)]
+
 
+
'''Семинар 10.''' Градиентный бустинг. Часть 1 | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%2010 GitHub]
+
* [https://youtu.be/2rrZwakmFwM?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 15.11.2021)]
+
* [https://youtu.be/NfWxdBIh9Qc?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 16.11.2021)]
+
* [https://youtu.be/r_U-7L8H6qk?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 17.11.2021)]
+
 
+
'''Семинар 11.''' Градиентный бустинг. Часть 2 | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%2011 GitHub]
+
* [https://youtu.be/cH71Ofc4NG4?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 22.11.2021)]
+
* [https://youtu.be/iLAdTx96CGw?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 23.11.2021)]
+
* [https://youtu.be/Ab3s4PvHnFE?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 24.11.2021)]
+
 
+
'''Семинар 12.''' Кластеризация | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%2012 GitHub]
+
* [https://youtu.be/AbN9i3cG7C8?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 29.11.2021)]
+
* [https://youtu.be/oUxs_u8Ac2c?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 30.11.2021)]
+
* [https://youtu.be/Aa1gM4qxcLE?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 01.12.2021)]
+
 
+
'''Семинар 13.''' Временные ряды. Поиск выбросов и аномалий | [https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары/Семинар%2013 GitHub]
+
* [https://youtu.be/M_YSgos2KQo?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Липатов Иван (Пн, 06.12.2021)]
+
* [https://youtu.be/ainHrzkIwOU?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Кантонистова Елена (Вт, 07.12.2021)]
+
* [https://youtu.be/gTVwISqjYF0?list=PLEwK9wdS5g0qi14fXKFnFzruUDg3nl6db Ананьева Марина (Ср, 08.12.2021)]
+
  
 
== Домашние задания ==
 
== Домашние задания ==

Версия 10:26, 29 августа 2022

О курсе

Преподаватели:

Лекции - Кантонистова Елена Олеговна

Семинары - Кантонистова Елена, Максимовская Анастасия, Конюшенко Юлия

Лекции и семинары

Канал курса: https://t.me/https://t.me/ml_econom_22

Лекции проводятся [где, когда]

Все материалы лекций и семинаров находятся здесь: https://github.com/Murcha1990/ML_econom_2022-2023

Как связаться с преподавателями и куда сдавать домашки

Группа Ссылка Преподаватель Учебный ассистент Инвайт в anytask Чат в telegram
[когда] [где] [телеграм Елена Кантонистова] [телеграм Алена] [инвайт] [ссылка Чат МО ФЭН1]
[когда] [где] [телеграм Анастасия Максимовская] [телеграм Алена] [инвайт] [ссылка Чат МО ФЭН2]
[когда] [где] [телеграм Юлия Конюшенко] [телеграм Алена] [инвайт] [ссылка Чат МО ФЭН3]

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • самостоятельные работы на семинарах (пятиминутки);
  • коллоквиум в сессию первого модуля (письменный);
  • домашние задания (в том числе соревнование на Kaggle);
  • экзамен в сессию второго модуля (письменный).

Все работы оцениваются в 10 баллов.


Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

0.35 * Домашнее задание + 0.2 * Коллоквиум + 0.2 * Работа на семинаре + 0.25 * Экзамен


  • Активная работа на семинаре добавляет +3 балла к следующей пятиминутке (максимум за пятиминутку в любом случае 10 баллов).
  • 20% слушателей с наибольшим накопленным баллом получают накопленный балл автоматом.

Коллоквиум

Коллоквиум будет проходить в сессию первого модуля [дата, время]
В письменной форме (на листочке).

Общая информация:

  • Коллоквиум рассчитан на 75 минут (1 час 15 мин), еще 5 минут у вас будет на проверку написанного и сдачу листочков.
  • Коллоквиум оценивается в 10 баллов и весит 20% от итоговой оценки за курс.
  • Если мы заподозрим, что вы списали, то и вы, и человек, поделившийся решением, получаете 0 баллов. В случае, если вы не согласны с обвинениями в списывании, вы можете защитить работу устно: в этом случае мы спросим решение абсолютно любого задания из вашей работы, а также можем попросить решить похожее задание не из варианта коллоквиума.

Описание заданий:

  • В заданиях 1 и 2 (с выбором вариантов ответа) необходимо указать варианты ответов, которые считаете верными, а также кратко обосновать, почему указанные варианты ответов верные, а остальные - нет.
  • В задании 3 (теоретическое без выбора ответа) необходимо дать максимально подробный и развёрнутый ответ.
  • В задании 4 (задача или пример) необходимо максимально подробно изложить ваши рассуждения и привести вычисления.
  • В задании 5 (задание на написание кода) старайтесь писать понятный код с интерпретируемыми обозначениями и названиями. Код пишется на листочке с комментариями. За ошибки в синтаксисе баллы НЕ снижаем.

Подготовительный вариант вы можете посмотреть здесь: https://docs.google.com/document/d/1xErmREQt0z9ab5plpMO_AYSv0xZtXi7rwcwMi5rZUw4/edit

Мы проведём консультацию к коллоквиуму онлайн и запишем её, запись выложим [тут].

Экзамен

Экзамен пройдёт [где, когда]. Для студентов, которые по объективным и подтверждённым причинам не могут писать экзамен в основной день, резервное время - [где, когда].

Экзамен будет состоять из 3-х частей:

  • Части A (тестовая с вариантами ответа) на 2.5 балла с 16-ю заданиями равного веса
  • Части B (задачи без вариантов ответа) на 3.5 балла с 6-ю заданиями равного веса
  • Части C (работа с набором данных) на 4 балла с заданиями индивидуального веса

Пройдет экзамен на платформе online.hse.ru, на его выполнение будет дано 80 мин. Пожалуйста, убедитесь, что вы подключены к курсу по этой ссылке: [ссылка]

Шкала перевода первичных баллов за тест в оценку за экзамен:

  • [6; 10] -> 10 баллов
  • [5.4; 6.0) - 9
  • [4.8; 5.4) - 8
  • [4.2; 4.8) - 7
  • [3.6; 4.2) - 6
  • [3; 3.6) - 5
  • [2.4; 3) - 4
  • [0; 2.4) - неуд.

По усмотрению преподавателей курса критерии перевода баллов могут быть смягчены после оценки общего результата по всем студентам


Обращаем ваше внимание на то, что в тесте могут быть вопросы, не изучавшиеся в рамках курса. Это компенсируется тем, что для получения максимальной оценки можно выполнить далеко не все задания (таким образом, если вы не можете решить что-то по программе настоящего курса, у вас есть возможность "отыграться" за счёт внепрограммных вопросов).

Во время написания экзамена можно пользоваться всеми материалами курса, а также средой программирования на Python (рекомендуем подготовить её перед экзаменом, чтобы не терять время).

Задания 1-4 (1.75 первичных балла суммарно) внутри части C будут целиком на pandas, для выполнения заданий 5-6 необходимо будет воспользоваться библиотекой scikit-learn.

Лекции

Материалы лекций: https://github.com/Murcha1990/ML_econom_2022-2023/tree/main/Лекции

Лекция 1 (когда) Введение в машинное обучение. | [ссылка на материалы на гитхабе]

Семинары

Материалы семинаров: https://github.com/Murcha1990/ML_Econom_2022-2023/tree/main/Семинары

Семинар 1. Основы регрессии. Градиентный спуск | [ссылка на семинар]

Домашние задания

На курсе планируется 7 домашних заданий, а будет 6. Формула вычисления итоговой оценки: взвешенное среднее из 6 5 домашних заданий с максимальными баллами.

Каждое домашнее задание имеет индивидуальный вес, который будет появляться одновременно с появлением очередного домашнего задания.

Все домашние работы, а также пятиминутки в начале семинаров необходимо сдавать в Anytask.

Домашняя работа 1. Линейная регрессия и векторное дифференцирование | Дедлайн - 29 сентября в 23:59

Домашняя работа 2. ML Pipeline | Дедлайн - 13 октября в 23:59

Домашняя работа 3. Модели классификации и оценка их качества | Дедлайн - 31 октября в 23:59 7 ноября в 23:59

Домашняя работа 4. kNN, DecisionTree, RandomForest, SGD classifier | Дедлайн - 25 ноября в 23:59

Домашняя работа 5. Kaggle InClass - Fraud Detection | Дедлайн - 13 декабря в 23:59

Домашняя работа 6. Бустинг. Снижение размерности | Дедлайн - 11 декабря в 23:59

Полезные материалы

Книги

  • Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.r, 2009.
  • Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.
  • Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. MIT Press, 2012.
  • Murphy K. Machine Learning: A Probabilistic Perspective. MIT Press, 2012.
  • Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
  • Willi Richert, Luis Pedro Coelho. Building Machine Learning Systems with Python. Packt Publishing, 2013.

Курсы по машинному обучению и анализу данных