НИС Прикладные задачи анализа данных (МОиВС, 2022) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
м (upd2 literature list)
 
(не показано 9 промежуточных версии 2 участников)
Строка 1: Строка 1:
 
==О курсе==
 
==О курсе==
Курс посвящен расширению кругозора обучающихся в области машинного и глубинного обучения. На курсе изучаются различные приложения анализа данных, которые, как правило, не входят в программы других дисциплин цикла. Среди изучаемых на курсе тем: поиск аномалий в данных, обзор алгоритмов построения рекомендаций, EM-алгоритм, нормализационные потоки и другие приложения.
+
Курс посвящен расширению кругозора обучающихся в области машинного и глубинного обучения. На курсе изучаются различные приложения анализа данных, которые, как правило, не входят в программы других дисциплин цикла. Среди изучаемых на курсе тем: поиск аномалий в данных, обзор алгоритмов построения рекомендаций, EM-алгоритм, нормализационные потоки и другие довольно важные приложения.
  
Занятия проводятся в [ Zoom] по ... в ...
+
Большинство занятий проводятся <s>на [https://events.webinar.ru/54933491/1441462596 Webinar.ru]</s> в [https://us06web.zoom.us/j/89547424816?pwd=ZFVLL1g4REcwMm94NGhuUjBxeUpWQT09 Zoom] '''по субботам с 12:00 до 13:20'''
  
 
==Контакты==
 
==Контакты==
Строка 22: Строка 22:
 
Ссылка на плейлист курса на YouTube: https://www.youtube.com/playlist?list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI
 
Ссылка на плейлист курса на YouTube: https://www.youtube.com/playlist?list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI
  
Ссылка на GitHub с материалами курса: [[ GitHub]]
+
Ссылка на GitHub с материалами курса: [https://github.com/Murcha1990/MLDS_AppliedDS_autumn2021.git Github]
  
 
{| class="wikitable"
 
{| class="wikitable"
Строка 28: Строка 28:
 
  ! Занятие !! Тема !! Дата !! Преподаватель !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
  ! Занятие !! Тема !! Дата !! Преподаватель !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
|-
 
|-
| style="background:#eaecf0;" | '''1''' || Рекомендательные системы || 17.09.22 || Цвигун Аким || ||
+
| style="background:#eaecf0;" | '''1''' ||[[https://www.youtube.com/watch?v=bRQ5vRnbKDg&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]] Рекомендательные системы || 17.09.22 || Цвигун Аким || [https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lectures08-09-recommender.pdf Конспект Жени Соколова по рекомендательным системам] ||
 
|-
 
|-
| style="background:#eaecf0;" | '''2''' || Поиск аномалий || 24.09.22 || Кантонистова Елена || ||  
+
| style="background:#eaecf0;" | '''2''' ||[[https://www.youtube.com/watch?v=zihwn5SFpI8&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]] Поиск аномалий || 24.09.22 || Кантонистова Елена || [https://www.youtube.com/watch?v=dxy_sxj27u4 Запись занятия Жени Соколова по поиску аномалий], [https://github.com/esokolov/ml-course-hse/blob/master/2020-spring/lecture-notes/lecture16-anomaly.pdf Конспект] ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''3''' || Нормализационные потоки || 01.10.22 || Гущин Михаил|| ||
+
| style="background:#eaecf0;" | '''3''' || [[https://www.youtube.com/watch?v=qRk4B_3Rbfo&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]]Нормализационные потоки || 01.10.22 || Гущин Михаил || [https://www.youtube.com/watch?v=1WYXIGsD_5M Лекция Михаила на ИАДе] ||
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' || Быстрый поиск ближайших соседей || 08.10.22 || Бокатенко Данил || ||
+
| style="background:#eaecf0;" | '''4''' || [[https://www.youtube.com/watch?v=K8tE2IEKojA&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]] AutoML || 04.10.22 || Садртдинов Ильдус || [https://www.youtube.com/watch?v=oG3dg2t2mVc&list=PLEwK9wdS5g0o_HWWtNffNsBPpNmeuSDYV Лекция Жени Соколова на МО-2] ||  
 +
Байесовская оптимизация:
 +
* [https://towardsdatascience.com/a-conceptual-explanation-of-bayesian-model-based-hyperparameter-optimization-for-machine-learning-b8172278050f Статья на TDS],
 +
* [https://en.wikipedia.org/wiki/Bayesian_optimization Википедия],
 +
* [https://distill.pub/2020/bayesian-optimization/ на Distill]
 +
 
 +
Гауссовские процессы:
 +
* [https://bigbird.comp.nus.edu.sg/pmwiki/farm/mlss/uploads/Site/lect1gp.pdf A Tutorial on Gaussian Processes]
 +
* [https://thegradient.pub/gaussian-process-not-quite-for-dummies/ на TheGradient]
 +
* [https://distill.pub/2019/visual-exploration-gaussian-processes/ "A Visual Exploration of Gaussian Processes" on Distill]
 
|-
 
|-
| style="background:#eaecf0;" | '''5''' || Графовый подход в задаче кластеризации || 15.10.22 || Бокатенко Данил || ||
+
| style="background:#eaecf0;" | '''5''' ||[[https://www.youtube.com/watch?v=E6e7AzF4o2Q&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]] Быстрый поиск ближайших соседей || 08.10.22 || Бокатенко Данил || Хэш-функции ||
 
|-
 
|-
| style="background:#eaecf0;" | '''6''' || AutoML || 18.10.22 || Садртдинов Ильдус || ||
+
| style="background:#eaecf0;" | '''6''' || [[https://www.youtube.com/watch?v=X5LmHgOcly0&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]] Графовый подход в задаче кластеризации || 15.10.22 || Бокатенко Данил || Собственные значения и собственные векторы матрицы || [https://arxiv.org/pdf/0711.0189.pdf Подробная статья по спектральной кластеризации]
 
|-
 
|-
| style="background:#eaecf0;" | '''7''' || EM-алгоритм || 22.10.22 || Максим Рябинин || ||
+
| style="background:#eaecf0;" | '''7''' || [[https://www.youtube.com/watch?v=ZZsTFvha8uA&list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI Запись]] EM-алгоритм || 22.10.22 || Максим Рябинин || ||
 
|-
 
|-
 
|}
 
|}
Строка 51: Строка 60:
  
 
== Домашние задания ==
 
== Домашние задания ==
 +
 +
По курсу предусмотрено 2 домашних задания
 +
 +
# По семейству генеративных моделей (на сравнение GAN'ов, автоэнкодеров и нормализационных потоков)
 +
# По AutoML
 +
 +
А вот и они:
 +
# [https://github.com/Murcha1990/MLDS_AppliedDS_autumn2021/tree/main/HWs/hw1_GenModels GANs vs VAEs vs NF], '''Дедлайн - 16.10.22 (Вс) 23:59''', ''Выдано - 01.10.22''
 +
# [https://github.com/Murcha1990/MLDS_AppliedDS_autumn2021/blob/main/HWs/hw2_AutoML AutoML], '''Дедлайн - 22.10.22 (Сб) 23:59''', ''Выдано - 05.10.22''
  
 
== Литература ==
 
== Литература ==
 +
RecSys:
 +
* Ким Фальк, "Рекомендательные системы на практике";
 +
* [https://habr.com/ru/company/retailrocket/blog/345226/ Статья на Хабре со ссылками на избранные статьи с ACM RecSys];
 +
* [http://www.machinelearning.ru/wiki/images/0/0f/PZAD2017_11_recsys.pdf Слайды лекции лекции Дьяконова А.Г. в МГУ];
 +
* Charu C. Aggarwal. Recommender Systems: The Textbook, Springer;
 +
* Recommender Systems Handbook. Francesco Ricci, Lior Rokach, Bracha Shapira (Eds.), Springer
 +
 +
Anomaly Detection:
 +
* [https://github.com/yzhao062/anomaly-detection-resources '''anomaly-detection-resources''' repo on GitHub]
 +
 +
Normalizing Flows:
 +
* [https://arxiv.org/pdf/1908.09257.pdf Normalizing Flows: An Introduction and Review of Current Methods]
 +
* [https://github.com/janosh/awesome-normalizing-flows '''awesome-normalizing-flows''' repo on GitHub]
 +
 +
AutoML:
 +
* [https://www.automl.org/ AutoML team of Leibniz University of Hannover website]
 +
* yet another awesome repo [https://github.com/hibayesian/awesome-automl-papers '''Awesome-AutoML-Papers :)''']
 +
 +
Other:
 +
* [https://cdn1.sph.harvard.edu/wp-content/uploads/sites/1268/2020/11/ciwhatif_hernanrobins_23nov20.pdf Хорошая книга по causal inference]

Текущая версия на 16:26, 3 ноября 2022

О курсе

Курс посвящен расширению кругозора обучающихся в области машинного и глубинного обучения. На курсе изучаются различные приложения анализа данных, которые, как правило, не входят в программы других дисциплин цикла. Среди изучаемых на курсе тем: поиск аномалий в данных, обзор алгоритмов построения рекомендаций, EM-алгоритм, нормализационные потоки и другие довольно важные приложения.

Большинство занятий проводятся на Webinar.ru в Zoom по субботам с 12:00 до 13:20

Контакты

Канал курса в TG: channel link

Чат курса в TG: chat link

Ассистенты Контакты
Червяков Артем @arorlov
Прохоров Савелий @Savely_Prokhorov

Материалы курса

Ссылка на плейлист курса на YouTube: https://www.youtube.com/playlist?list=PLmA-1xX7IuzDT8M0NfFg6r5IXLoFx7xsI

Ссылка на GitHub с материалами курса: Github

Занятие Тема Дата Преподаватель Материалы для самоподготовки к семинарам Дополнительные материалы
1 [Запись] Рекомендательные системы 17.09.22 Цвигун Аким Конспект Жени Соколова по рекомендательным системам
2 [Запись] Поиск аномалий 24.09.22 Кантонистова Елена Запись занятия Жени Соколова по поиску аномалий, Конспект
3 [Запись]Нормализационные потоки 01.10.22 Гущин Михаил Лекция Михаила на ИАДе
4 [Запись] AutoML 04.10.22 Садртдинов Ильдус Лекция Жени Соколова на МО-2

Байесовская оптимизация:

Гауссовские процессы:

5 [Запись] Быстрый поиск ближайших соседей 08.10.22 Бокатенко Данил Хэш-функции
6 [Запись] Графовый подход в задаче кластеризации 15.10.22 Бокатенко Данил Собственные значения и собственные векторы матрицы Подробная статья по спектральной кластеризации
7 [Запись] EM-алгоритм 22.10.22 Максим Рябинин

Формула оценивания

Оценка = 0.3*тесты + 0.7*ДЗ

В начале занятия - тест (4-5 несложных вопросов) по теме предыдущего занятия.

Домашние задания

По курсу предусмотрено 2 домашних задания

  1. По семейству генеративных моделей (на сравнение GAN'ов, автоэнкодеров и нормализационных потоков)
  2. По AutoML

А вот и они:

  1. GANs vs VAEs vs NF, Дедлайн - 16.10.22 (Вс) 23:59, Выдано - 01.10.22
  2. AutoML, Дедлайн - 22.10.22 (Сб) 23:59, Выдано - 05.10.22

Литература

RecSys:

Anomaly Detection:

Normalizing Flows:

AutoML:

Other: