Прикладные задачи анализа данных/2024
Содержание
О курсе
Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.
Проводится с 2016 года.
Лекции проходят по четвергам в 13:00 по [ ссылке].
Полезные ссылки
Репозиторий с материалами на GitHub
Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)
Канал в telegram для объявлений
Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы)
Таблица с оценками
Семинары
Группа | Преподаватель | Учебный ассистент | Zoom-конференция | Ссылка на чат | Инвайт в anytask |
---|---|---|---|---|---|
ИАД-1 | Артем Червяков | Овчинников Вячеслав | Zoom | Чат | 73TKmAE |
ИАД-2 | Александр Рогачев | Иван Смоленчук, Присталов Ярослав | Zoom | Чат | HlpH0lb |
ИАД-3 | Александр Бредихин | Анастасия Зайцева | Zoom | Чат | 9seivZz |
ИАД-4 | Марк Блуменау | Егор Горяной | Zoom | Чат | IRx20G6 |
ИАД-5 | Еленик Константин | Бичурина Елизавета | Zoom | Чат | VmVhvMm |
ИАД-6 | Михаил Никифоров | Анастасия Кеммер | Zoom | Чат | Gd8a9wC |
ИАД-7 | Кантонистова Елена | Карагодин Никита | Zoom | Чат | P2f0IkQ |
ИАД-8 | Косакин Даниил | Козлов Кирилл | Zoom | Чат | gIeDYHh |
ИАД-9 | Косакин Даниил | Трофименко Илья, Никита Горевой | Zoom | Чат | BsMrA6v |
ИАД-10 | Филипп Ульянкин | Александр Зайцев, Никита Горевой | Zoom | Чат | hSl0gyh |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Практические домашние работы на Python
- Контрольная где-то в середине курса
- Письменный экзамен
Итоговая оценка вычисляется по формуле:
Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)
ДЗ — средняя оценка за практические домашние задания
КР — оценка за контрольную работу
Э — оценка за экзамен
Итоговое округление арифметическое.
Правила сдачи заданий
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.
Два раза студент может сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов. Также разрешается в конце курса написать одну проверочную, пропущенную без уважительной причины.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Лекции
Все лекции лежат на гитхабе.
Лекция 1 (25.01.2024). Генеративно-состязательные сети. [Слайды] [Запись лекции].
Лекция 2 (08.02.2024). Генеративные модели для изображений. [Слайды] [Запись лекции].
Лекция 3 (22.02.2024). 3D-реконструкция. [Слайды] [Запись лекции].
Лекция 4 (22.02.2024). Нормализационные потоки. [Слайды] [Запись лекции].
Лекция 5 (29.02.2024). DL в звуке 1. [Слайды] [Запись лекции].
Лекция 6 (07.03.2024). DL в звуке 2. [Слайды] [Запись лекции].
Лекция 7 (14.03.2024). State of the LLM Landscape. [Слайды] [Запись лекции].
Лекция 8 (21.03.2024). Some Notes on LLMs in the Wild. [Слайды] [Запись лекции].
Лекция 9 (04.04.2024). Введение в глубинное обучение в анализе графовых данных. [Слайды] [Запись лекции].
Лекции 10, 11 (11.04.2024). Временные ряды: методы и задачи. [Слайды] [Запись лекции].
Лекция 12 (19.04.2024). Introduction to MLOps. [Слайды] [Запись лекции].
Лекция 13 (25.04.2024). Введение в современный MLOps. [Слайды] [Запись лекции].
Лекция 14 (16.05.2024). Recsys Intro. [Слайды] [Запись лекции].
Лекция 15 (23.05.2024). Recsys Advanced. [Слайды] [Запись лекции].
Лекция 16 (30.05.2024). Data Science in HealthTech. [Слайды] [Запись лекции].
Семинары
Семинар 1 (01.02.2024). Генеративно-состязательные сети. Тетрадка
Семинар 2 (15.02.2024). Диффузионные модели. Тетрадка
Семинар 3 (29.02.2024). Нормализационные потоки. Тетрадка
Семинар 4 (07.03.2024). NeRF: Neural Radiance Field. Тетрадка
Семинар 5 (14.03.2024). Обработка звука. Тетрадка
Семинар 6 (21.03.2024). Levenstein distance, Word Error Rate и CTC. Тетрадка
Семинар 7 (04.04.2024). Большие языковые модели. Тетрадка
Семинар 8 (11.04.2024). Обучение представлений на графах. Тетрадка
Семинар 9 (18.04.2024). Временные ряды I. Тетрадка
Семинар 10 (25.04.2024). Временные ряды II. Тетрадка
Семинар 11 (16.05.2024). Bash. Тетрадка
Семинар 12 (23.05.2024). Рекомендательные системы. Тетрадка
Семинар 13 (30.05.2024). Матричные факторизации. Тетрадка
Практические задания
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.
Задание 1. Генеративные модели
Мягкий дедлайн: 03 марта 2024 года 23:59
Жесткий дедлайн: 10 марта 2024 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw1_gan
Задание 2. Deep learning для обработки звука
Мягкий дедлайн: 21 апреля 2024 года 23:59
Жесткий дедлайн: 28 апреля 2024 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw2_audio
Задание 3. Временные ряды
Мягкий дедлайн: 19 мая 2024 года 23:59
Жесткий дедлайн: 26 мая 2024 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw3_ts
Задание 4. Рекомендательные системы
Мягкий и жесткий дедлайн: 16 июня 2024 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw4_recsys