Прикладные задачи анализа данных/2024

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.

Проводится с 2016 года.

Лекции проходят по четвергам в 13:00 по [ ссылке].

Полезные ссылки

Карточка курса и программа

Плейлист с записями лекций

Репозиторий с материалами на GitHub

Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)

Канал в telegram для объявлений

Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы)

Ссылка на курс в Anytask

Таблица с оценками

Семинары

Группа Преподаватель Учебный ассистент Zoom-конференция Ссылка на чат Инвайт в anytask
ИАД-1 Артем Червяков Овчинников Вячеслав Zoom Чат 73TKmAE
ИАД-2 Александр Рогачев Иван Смоленчук, Присталов Ярослав Zoom Чат HlpH0lb
ИАД-3 Александр Бредихин Анастасия Зайцева Zoom Чат 9seivZz
ИАД-4 Марк Блуменау Егор Горяной Zoom Чат IRx20G6
ИАД-5 Еленик Константин Бичурина Елизавета Zoom Чат VmVhvMm
ИАД-6 Михаил Никифоров Анастасия Кеммер Zoom Чат Gd8a9wC
ИАД-7 Кантонистова Елена Карагодин Никита Zoom Чат P2f0IkQ
ИАД-8 Косакин Даниил Козлов Кирилл Zoom Чат gIeDYHh
ИАД-9 Косакин Даниил Трофименко Илья, Никита Горевой Zoom Чат BsMrA6v
ИАД-10 Филипп Ульянкин Александр Зайцев, Никита Горевой Zoom Чат hSl0gyh

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Практические домашние работы на Python
  • Контрольная где-то в середине курса
  • Письменный экзамен

Итоговая оценка вычисляется по формуле:

Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

КР — оценка за контрольную работу

Э — оценка за экзамен

Итоговое округление арифметическое.

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

Два раза студент может сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов. Также разрешается в конце курса написать одну проверочную, пропущенную без уважительной причины.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Все лекции лежат на гитхабе.

Лекция 1 (25.01.2024). Генеративно-состязательные сети. [Слайды] [Запись лекции].

Лекция 2 (08.02.2024). Генеративные модели для изображений. [Слайды] [Запись лекции].

Лекция 3 (22.02.2024). 3D-реконструкция. [Слайды] [Запись лекции].

Лекция 4 (22.02.2024). Нормализационные потоки. [Слайды] [Запись лекции].

Лекция 5 (29.02.2024). DL в звуке 1. [Слайды] [Запись лекции].

Лекция 6 (07.03.2024). DL в звуке 2. [Слайды] [Запись лекции].

Лекция 7 (14.03.2024). State of the LLM Landscape. [Слайды] [Запись лекции].

Лекция 8 (21.03.2024). Some Notes on LLMs in the Wild. [Слайды] [Запись лекции].

Лекция 9 (04.04.2024). Введение в глубинное обучение в анализе графовых данных. [Слайды] [Запись лекции].

Лекции 10, 11 (11.04.2024). Временные ряды: методы и задачи. [Слайды] [Запись лекции].

Лекция 12 (19.04.2024). Introduction to MLOps. [Слайды] [Запись лекции].

Лекция 13 (25.04.2024). Введение в современный MLOps. [Слайды] [Запись лекции].

Лекция 14 (16.05.2024). Recsys Intro. [Слайды] [Запись лекции].

Лекция 15 (23.05.2024). Recsys Advanced. [Слайды] [Запись лекции].

Лекция 16 (30.05.2024). Data Science in HealthTech. [Слайды] [Запись лекции].

Семинары

Семинар 1 (01.02.2024). Генеративно-состязательные сети. Тетрадка

Семинар 2 (15.02.2024). Диффузионные модели. Тетрадка

Семинар 3 (29.02.2024). Нормализационные потоки. Тетрадка

Семинар 4 (07.03.2024). NeRF: Neural Radiance Field. Тетрадка

Семинар 5 (14.03.2024). Обработка звука. Тетрадка

Семинар 6 (21.03.2024). Levenstein distance, Word Error Rate и CTC. Тетрадка

Семинар 7 (04.04.2024). Большие языковые модели. Тетрадка

Семинар 8 (11.04.2024). Обучение представлений на графах. Тетрадка

Семинар 9 (18.04.2024). Временные ряды I. Тетрадка

Семинар 10 (25.04.2024). Временные ряды II. Тетрадка

Семинар 11 (16.05.2024). Bash. Тетрадка

Семинар 12 (23.05.2024). Рекомендательные системы. Тетрадка

Семинар 13 (30.05.2024). Матричные факторизации. Тетрадка

Практические задания

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. Студенту разрешается два раза сдать домашнее задание после мягкого дедлайна (но до жёсткого) без штрафов.

Задание 1. Генеративные модели

Мягкий дедлайн: 03 марта 2024 года 23:59

Жесткий дедлайн: 10 марта 2024 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw1_gan

Задание 2. Deep learning для обработки звука

Мягкий дедлайн: 21 апреля 2024 года 23:59

Жесткий дедлайн: 28 апреля 2024 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw2_audio

Задание 3. Временные ряды

Мягкий дедлайн: 19 мая 2024 года 23:59

Жесткий дедлайн: 26 мая 2024 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw3_ts

Задание 4. Рекомендательные системы

Мягкий и жесткий дедлайн: 16 июня 2024 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/2024/homeworks/hw4_recsys

Контрольная работа

Экзамен

Страницы прошлых лет

2022/23 учебный год

2021/22 учебный год

2020/21 учебный год

2019/20 учебный год

2018/19 учебный год

2017/18 учебный год

2016/17 учебный год