Прикладные задачи анализа данных/2022

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.

Проводится с 2016 года.

Лекции проходят по четвергам в 11:10 по ссылке.

Полезные ссылки

Карточка курса и программа

Репозиторий с материалами на GitHub

Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)

Канал в telegram для объявлений: https://t.me/hs_iad_2021

Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы): https://t.me/+Vuq4Lgi98RG22fQP

Ссылка на курс в Anytask: https://anytask.org/course/926

Таблица с оценками: https://docs.google.com/spreadsheets/d/1ldHwaK38SdeLVJh0h-RUSRf4bgRjBPdhS9J73AASJb0/edit?usp=sharing

Распределение студентов по проверяющим ассистентам: https://docs.google.com/spreadsheets/d/14FP82sGnpMYG-WFOFKL_CtDVRDuuCJGVUVlLTDVvWLQ/edit?usp=sharing

Семинары

Группа Преподаватель Учебный ассистент Zoom-конференция Ссылка на чат Инвайт в anytask
ИАД-1 Васильковский Михаил Добротворский Николай, Григорян Михаил Zoom Чат sF8bn01
ИАД-2 Ковалёв Алексей Егор Масликов, Григорян Михаил Zoom Чат vP3Pgs7
ИАД-3 Гельван Кирилл Егор Масликов, Анищенко Илья, Матяш Дарья Zoom Чат T5EoC7f
ИАД-4 Гущин Михаил Матяш Дарья, Пономаренко Александр, Довгополый Иоанн Zoom Чат WGxLiR3
ИАД-5 Анжела Сухорева Довгополый Иоанн, Барышников Антон, Фадеев Егор Zoom Чат MNMUy1Y
ИАД-6 Кантонистова Елена Фадеев Егор, Тамогашев Кирилл Zoom Чат YMo2fg2
ИАД-7 Антон Семенкин Тамогашев Кирилл, Никифоров Михаил, Аверьянов Николай Zoom Чат SWhHMzu

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Практические домашние работы на Python
  • Контрольная где-то в середине курса
  • Письменный экзамен

Итоговая оценка вычисляется по формуле:

Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

КР — оценка за контрольную работу

Э — оценка за экзамен

Итоговое округление арифметическое.

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

Два раза студент может сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов. Также разрешается в конце курса написать одну проверочную, пропущенную без уважительной причины.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Лекция 1 (20.01.2022). Задачи порождения изображений. Perceptual loss. Перенос стиля. Superresolution. [Слайды] [Запись лекции]

Лекция 2 (27.01.2022). Вариационные Автокодировщики. [Слайды] [Запись лекции]

Лекция 3 (03.02.2022). Генеративно-состязательные сети. [Слайды] [Запись лекции]

Лекция 4 (10.02.2022). Нормализационные потоки. [Слайды] [Запись лекции]

Лекция 5 (10.02.2022). Глубинное обучение для обработки звука. [Слайды] [Запись лекции]

Лекция 6 (03.03.2022). Синтез речи, TTS. [Конспект] [Запись лекции]

Лекция 7 (10.03.2022). Анализ временных рядов. [Конспект] [Запись лекции]

Лекция 8 (17.03.2022). Анализ временных рядов. Продолжение. [Выкладки с лекции] [Запись лекции]

Лекция 9 (24.03.2022). Современные методы обработки языка. NLP. [Презентация с лекции] [дополнительные выкладки] [Запись лекции]

Лекция 10 (10.04.2022). Рекомендательные системы. Ранжирование. Метрики ранжирования [Конспект] [Запись лекции]

Лекция 10.2 (20.04.2022, асинхронно). Рекомендательные системы 2 [Запись 1 (от 18.03.2021)] [Запись 2 (от 25.03.2021)] [Конспект]

Лекция 11 (21.04.2022). A/B тестирование. [Презентация с лекции] [Запись лекции]

Лекция 12 (28.04.2022). A/B тестирование. Продолжение. [Презентация с лекции] [Запись лекции]

Лекция 13 (12.05.2022). Поиск аномалий. [Конспект] [Запись лекции]

Лекция 14 (02.06.2022). 3D Vision [Презентация с лекции] [Запись лекции]

Семинары

Семинар 1 (27.01.2022). Задачи порождения изображений. Perceptual loss. Перенос стиля. Superresolution. [Тетрадка] [Colab]

Семинар 2 (03.02.2022). Автокодировщики. [Тетрадка] [Colab]

Семинар 3 (10.02.2022). Генеративно-состязательные сети. [Тетрадка] [Colab]

Семинар 4 (17.02.2022). Нормализационные потоки. [Тетрадка] [Colab]

Семинар 5 (24.02.2022). Обработка звука 1. [Тетрадка] [Colab]

Семинар 6 (03.03.2022). Обработка звука 2. [Тетрадка] [Colab]

Семинар 7 (17.03.2022). Временные ряды. [Тетрадка]

Семинар 8 (24.03.2022). Временные ряды 2. [Тетрадка]

Семинар 9 (31.03.2022). NER. [Тетрадка]

Семинар 11 (21.04.2022). Рекомендательные системы 2. [Тетрадка]

Семинар 12 (28.04.2022). Случайные величины и нормальное распределение. Проверка гипотез. A/B тестирование. [Тетрадка]

Семинар 13 (12.05.2022). Идея статистического вывода. Сравнение средних и t-тест. Хи-квадрат. [Тетрадка]

Семинар 14 (26.05.2022). Anomaly Detection. [Тетрадка]

Семинар 15 (09.06.2022). 3D Vision. [Тетрадка]

Практические задания

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.

Задание 1. Генеративные модели

Вам предстоит применить генеративно-состязательные сети и вариационный автокодировщик для быстрой симуляции параметров изображений системы двух черенковских телескопов MAGIC (Major Atmospheric Gamma Imaging Cherenkov).

Мягкий дедлайн: 03 марта 2022 года 23:59

Дедлайн: 06 марта 2022 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2022/hw/hw1

Задание 2. Deep learning для обработки звука

В этом задании Вы поработаете и разберетесь в деталях с форматами представления аудиоданных в задачах глубинного обучения, а так же напишете несколько моделей для классификации аудиозаписей.

Мягкий дедлайн: 23:30 1 апреля

Дедлайн: 23:30 4 апреля

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2022/hw/hw2

Задание 3. Прогнозирование временных рядов

В этом задании Вам предстоит разобраться с основами анализа и прогнозирования временных рядов.

Мягкий дедлайн: 24 апреля в 23:59

Дедлайн: 28 апреля 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2022/hw/HW3.ipynb

Задание 4. Рекомендательные системы

В этом задании Вы продолжите работать с данными из семинара Articles Sharing and Reading from CI&T Deskdrop.

Мягкий дедлайн: 25 мая в 23:59

Дедлайн: 1 июня 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/blob/master/2022/hw/hw4/HW4.ipynb

Контрольная работа

Вопросы для подготовки: GoogleDoc

Контрольная пройдет 19 мая на второй паре (11:10 - 12:30)

Нужно включить видео в Zoom (приоритет -- рукам), демонстрацию всего рабочего стола. Решения пишем ручкой на пустых листах бумаги или на планшете (его должно быть видно целиком).

На загрузку решений предусмотрены дополнительные 10 мин. После 12:40 (+ возможная задержка начала) работы не принимаются

Экзамен

Вопросы для подготовки: GoogleDoc

23 июня (четверг) в 11:00 пишем экзамен. Он будет длиться 2 часа (120 минут), все будет в зуме, правила действуют такие же, как и на контрольной.

Страницы прошлых лет

2020/21 учебный год

2019/20 учебный год

2018/19 учебный год

2017/18 учебный год

2016/17 учебный год