Прикладные задачи анализа данных/2022
Содержание
О курсе
Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.
Проводится с 2016 года.
Лекции проходят по четвергам в 11:10 по ссылке.
Полезные ссылки
Репозиторий с материалами на GitHub
Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)
Канал в telegram для объявлений: https://t.me/hs_iad_2021
Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы): https://t.me/+Vuq4Lgi98RG22fQP
Ссылка на курс в Anytask: https://anytask.org/course/926
Таблица с оценками: https://docs.google.com/spreadsheets/d/1ldHwaK38SdeLVJh0h-RUSRf4bgRjBPdhS9J73AASJb0/edit?usp=sharing
Распределение студентов по проверяющим ассистентам: https://docs.google.com/spreadsheets/d/14FP82sGnpMYG-WFOFKL_CtDVRDuuCJGVUVlLTDVvWLQ/edit?usp=sharing
Семинары
Группа | Преподаватель | Учебный ассистент | Zoom-конференция | Ссылка на чат | Инвайт в anytask |
---|---|---|---|---|---|
ИАД-1 | Васильковский Михаил | Добротворский Николай, Григорян Михаил | Zoom | Чат | sF8bn01 |
ИАД-2 | Ковалёв Алексей | Егор Масликов, Григорян Михаил | Zoom | Чат | vP3Pgs7 |
ИАД-3 | Гельван Кирилл | Егор Масликов, Анищенко Илья, Матяш Дарья | Zoom | Чат | T5EoC7f |
ИАД-4 | Гущин Михаил | Матяш Дарья, Пономаренко Александр, Довгополый Иоанн | Zoom | Чат | WGxLiR3 |
ИАД-5 | Анжела Сухорева | Довгополый Иоанн, Барышников Антон, Фадеев Егор | Zoom | Чат | MNMUy1Y |
ИАД-6 | Кантонистова Елена | Фадеев Егор, Тамогашев Кирилл | Zoom | Чат | YMo2fg2 |
ИАД-7 | Антон Семенкин | Тамогашев Кирилл, Никифоров Михаил, Аверьянов Николай | Zoom | Чат | SWhHMzu |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Практические домашние работы на Python
- Контрольная где-то в середине курса
- Письменный экзамен
Итоговая оценка вычисляется по формуле:
Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)
ДЗ — средняя оценка за практические домашние задания
КР — оценка за контрольную работу
Э — оценка за экзамен
Итоговое округление арифметическое.
Правила сдачи заданий
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.
Два раза студент может сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов. Также разрешается в конце курса написать одну проверочную, пропущенную без уважительной причины.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Лекции
Лекция 1 (20.01.2022). Задачи порождения изображений. Perceptual loss. Перенос стиля. Superresolution. [Слайды] [Запись лекции]
Лекция 2 (27.01.2022). Вариационные Автокодировщики. [Слайды] [Запись лекции]
Лекция 3 (03.02.2022). Генеративно-состязательные сети. [Слайды] [Запись лекции]
Лекция 4 (10.02.2022). Нормализационные потоки. [Слайды] [Запись лекции]
Лекция 5 (10.02.2022). Глубинное обучение для обработки звука. [Слайды] [Запись лекции]
Лекция 6 (03.03.2022). Синтез речи, TTS. [Конспект] [Запись лекции]
Лекция 7 (10.03.2022). Анализ временных рядов. [Конспект] [Запись лекции]
Лекция 8 (17.03.2022). Анализ временных рядов. Продолжение. [Выкладки с лекции] [Запись лекции]
Лекция 9 (24.03.2022). Современные методы обработки языка. NLP. [Презентация с лекции] [дополнительные выкладки] [Запись лекции]
Лекция 10 (10.04.2022). Рекомендательные системы. Ранжирование. Метрики ранжирования [Конспект] [Запись лекции]
Лекция 10.2 (20.04.2022, асинхронно). Рекомендательные системы 2 [Запись 1 (от 18.03.2021)] [Запись 2 (от 25.03.2021)] [Конспект]
Лекция 11 (21.04.2022). A/B тестирование. [Презентация с лекции] [Запись лекции]
Лекция 12 (28.04.2022). A/B тестирование. Продолжение. [Презентация с лекции] [Запись лекции]
Лекция 13 (12.05.2022). Поиск аномалий. [Конспект] [Запись лекции]
Лекция 14 (02.06.2022). 3D Vision [Презентация с лекции] [Запись лекции]
Семинары
Семинар 1 (27.01.2022). Задачи порождения изображений. Perceptual loss. Перенос стиля. Superresolution. [Тетрадка] [Colab]
Семинар 2 (03.02.2022). Автокодировщики. [Тетрадка] [Colab]
Семинар 3 (10.02.2022). Генеративно-состязательные сети. [Тетрадка] [Colab]
Семинар 4 (17.02.2022). Нормализационные потоки. [Тетрадка] [Colab]
Семинар 5 (24.02.2022). Обработка звука 1. [Тетрадка] [Colab]
Семинар 6 (03.03.2022). Обработка звука 2. [Тетрадка] [Colab]
Семинар 7 (17.03.2022). Временные ряды. [Тетрадка]
Семинар 8 (24.03.2022). Временные ряды 2. [Тетрадка]
Семинар 9 (31.03.2022). NER. [Тетрадка]
Семинар 11 (21.04.2022). Рекомендательные системы 2. [Тетрадка]
Семинар 12 (28.04.2022). Случайные величины и нормальное распределение. Проверка гипотез. A/B тестирование. [Тетрадка]
Семинар 13 (12.05.2022). Идея статистического вывода. Сравнение средних и t-тест. Хи-квадрат. [Тетрадка]
Семинар 14 (26.05.2022). Anomaly Detection. [Тетрадка]
Семинар 15 (09.06.2022). 3D Vision. [Тетрадка]
Практические задания
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.
Задание 1. Генеративные модели
Вам предстоит применить генеративно-состязательные сети и вариационный автокодировщик для быстрой симуляции параметров изображений системы двух черенковских телескопов MAGIC (Major Atmospheric Gamma Imaging Cherenkov).
Мягкий дедлайн: 03 марта 2022 года 23:59
Дедлайн: 06 марта 2022 года 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2022/hw/hw1
Задание 2. Deep learning для обработки звука
В этом задании Вы поработаете и разберетесь в деталях с форматами представления аудиоданных в задачах глубинного обучения, а так же напишете несколько моделей для классификации аудиозаписей.
Мягкий дедлайн: 23:30 1 апреля
Дедлайн: 23:30 4 апреля
Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2022/hw/hw2
Задание 3. Прогнозирование временных рядов
В этом задании Вам предстоит разобраться с основами анализа и прогнозирования временных рядов.
Мягкий дедлайн: 24 апреля в 23:59
Дедлайн: 28 апреля 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2022/hw/HW3.ipynb
Задание 4. Рекомендательные системы
В этом задании Вы продолжите работать с данными из семинара Articles Sharing and Reading from CI&T Deskdrop.
Мягкий дедлайн: 25 мая в 23:59
Дедлайн: 1 июня 23:59
Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2022/hw/hw4/HW4.ipynb
Контрольная работа
Вопросы для подготовки: GoogleDoc
Контрольная пройдет 19 мая на второй паре (11:10 - 12:30)
Нужно включить видео в Zoom (приоритет -- рукам), демонстрацию всего рабочего стола. Решения пишем ручкой на пустых листах бумаги или на планшете (его должно быть видно целиком).
На загрузку решений предусмотрены дополнительные 10 мин. После 12:40 (+ возможная задержка начала) работы не принимаются
Экзамен
Вопросы для подготовки: GoogleDoc
23 июня (четверг) в 11:00 пишем экзамен. Он будет длиться 2 часа (120 минут), все будет в зуме, правила действуют такие же, как и на контрольной.