Прикладные задачи анализа данных
Содержание
О курсе
Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.
Проводится с 2016 года.
Лекции проходят по четвергам в 13:00 по ссылке.
Полезные ссылки
Репозиторий с материалами на GitHub
Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)
Канал в telegram для объявлений: https://t.me/hse_iad_22
Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы): https://t.me/+pbt8rRfldsUzZGUy
Ссылка на курс в Anytask: https://anytask.org/course/1019
Таблица с оценками:
Семинары
Группа | Преподаватель | Учебный ассистент | Zoom-конференция | Ссылка на чат | Записи семинаров | Инвайт в anytask |
---|---|---|---|---|---|---|
ИАД-1 | Семенкин Антон | Попова Диана, Романенко Александр | Zoom | Чат | Ссылка на диск | fBKLsae |
ИАД-2 | Масликов Егор | Казюлина Марина, Лапшина Ксения | Zoom | Чат | Ссылка на диск | I3NDyaQ |
ИАД-3 | Семенкин Антон | Панков Алексей, Плахин Александр | Zoom | Чат | Ссылка на диск | fBKLsae |
ИАД-4 | Кантонистова Елена | Смоленчук Иван | Zoom | Чат | Ссылка на диск | ixncvQX |
ИАД-5 | Гущин Михаил | Щетинина Алиса | Zoom | Чат | Ссылка на диск | DdgUBzO |
ИАД-6 | Бредихин Александр | Сорокина Татьяна | Zoom | Чат | Ссылка на диск | 82dWSw4 |
ИАД-7 | Баранов Михаил | Блуменау Марк | Zoom | Чат | Ссылка на диск | EgLwETX |
ИАД-9 | Никифоров Михаил | Плющ Евгений | Zoom | Чат | Ссылка на диск | vWSao0w |
ИАД-10 | Егоров Андрей | Татаринов Никита | Zoom | Чат | Ссылка на диск | h4SDuJX |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Практические домашние работы на Python
- Контрольная где-то в середине курса
- Письменный экзамен
Итоговая оценка вычисляется по формуле:
Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)
ДЗ — средняя оценка за практические домашние задания
КР — оценка за контрольную работу
Э — оценка за экзамен
Итоговое округление арифметическое.
Правила сдачи заданий
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.
Два раза студент может сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов. Также разрешается в конце курса написать одну проверочную, пропущенную без уважительной причины.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Лекции
Лекция 1 (19.01.2023). Генеративно-состязательные сети. [Слайды] [Запись лекции]
Лекция 2 (26.01.2023). Нормализационные потоки. [Слайды] [Запись лекции]
Лекция 3 (02.02.2023). Диффузионные генеративные модели. [Слайды] [Запись лекции]
Лекция 4 (09.02.2023) 3D methods in CV. [Слайды] [Запись лекции]
Лекция 5 (16.02.2023) QuestionAnswering. [Слайды] [Запись лекции]
Лекция 6 (09.03.2023) NLP. [Слайды] [Запись лекции]
Лекция 7 (16.03.2023) Временные ряды 1. [Слайды] [Запись лекции]
Лекция 8 (23.03.2023) Временные ряды 2. [Слайды ] [Запись лекции]
Лекция 9 (06.04.2023) DL в анализе графовых данных [Слайды] [Запись лекции]
Лекция 10 (13.04.2023) Рекомендательные системы [Слайды] [Доп.материал] [Запись лекции]
Лекция 11 (20.04.2023) Продуктовая аналитика 1. [Слайды] [Тетрадка по NPS] [Запись лекции]
Лекция 12 (27.04.2023) DL для звука 1. [Слайды 1] [Слайды 2] [Запись лекции]
Лекция 13 (04.05.2023) DL для звука 2. [Слайды] [Запись лекции]
Лекция 14 (11.05.2023) Продуктовая аналитика 2. [Слайды] [Запись лекции]
Лекция 15 (25.05.2023) Reinforcement learning. [Запись лекции]
Лекция 16 (08.06.2023) MLOps. [Запись лекции]
Семинары
Семинар 1 (26.01.2023). Генеративно-состязательные сети. Тетрадка
Семинар 2 (02.02.2023). Нормализационные потоки. Тетрадки
Семинар 3 (09.02.2023). Диффузионные модели. Тетрадка
Семинар 4 (16.02.2023). NeRF: Neural Radiance Field. Тетрадки
Семинар 5 (02.03.2023). QuestionAnswering. Тетрадка
Семинар 6 (16.03.2023). Time Series. ETNA. Тетрадка
Семинар 7 (06.04.2023). Time Series 2. Тетрадка
Семинар 8 (13.04.2023). Задачи на графах. Тетрадка
Семинар 9 (20.04.2023). Рекомендательные системы. Тетрадка
Семинар 10 (27.04.2023). Статистика и A/B тестирование. Тетрадка
Семинар 11 (11.05.2023). Обработка звука. Тетрадка
Семинар 12 (25.05.2023). RL. Ссылки скоро появятся :)
Семинар 13 (08.06.2023). MLOps Тетрадка
Практические задания
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.
Задание 1. Генеративные модели
Мягкий дедлайн: 02 марта 2023 года 23:59
Жесткий дедлайн: 07 марта 2023 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2023/hw/hw1
Задание 2. NLP
Мягкий дедлайн: 20 апреля 2023 года 23:59
Жесткий дедлайн: 27 апреля 2023 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2023/hw/hw2/HW_NLP.ipynb
Задание 3. Временные ряды
Мягкий дедлайн: 14 мая 2023 года 23:59
Жесткий дедлайн: 18 мая 2023 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2023/hw/hw3/hw03.ipynb
Задание 4. Рекомендательные системы
Мягкий дедлайн: 7 июня 2023 года 23:59
Жесткий дедлайн: 14 июня 2023 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2023/hw/hw4
Задание 5. Deep learning для обработки звука
Мягкий дедлайн: 20 июня 2023 года 23:59
Жесткий дедлайн: 20 июня 2023 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2023/hw/hw5
Контрольная работа
Дата: 1 июня 2023
Список вопросов: Тык
Консультация к контрольной Запись