Прикладные задачи анализа данных/2022 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
(не показано 13 промежуточных версии 5 участников)
Строка 9: Строка 9:
 
=== Полезные ссылки ===
 
=== Полезные ссылки ===
  
[https://www.hse.ru/ba/ami/courses/316531786.html Карточка курса и программа]
+
[https://www.hse.ru/edu/courses/416017381 Карточка курса и программа]
  
 
[https://github.com/hse-ds/iad-applied-ds Репозиторий с материалами на GitHub]
 
[https://github.com/hse-ds/iad-applied-ds Репозиторий с материалами на GitHub]
Строка 35: Строка 35:
 
| ИАД-3 || Чесаков Даниил  || Ревина Полина || [https://zoom.us/j/94956280541?pwd=KzJrZzlUUDJ0Rnc0dTZIbjZlNjdzZz09 Zoom] || [https://t.me/joinchat/ES5w2w4fersnpdf0UWoMNw Чат]|| https://github.com/Danyache/minor2021-iad3-spring || xAWTEmD
 
| ИАД-3 || Чесаков Даниил  || Ревина Полина || [https://zoom.us/j/94956280541?pwd=KzJrZzlUUDJ0Rnc0dTZIbjZlNjdzZz09 Zoom] || [https://t.me/joinchat/ES5w2w4fersnpdf0UWoMNw Чат]|| https://github.com/Danyache/minor2021-iad3-spring || xAWTEmD
 
|-
 
|-
| ИАД-4 || Кузнецов Максим || Саночкин Юрий || [https://zoom.us/j/95689153191?pwd=REp2R1hKcmFXRk9CTUxxRTFjRjFZUT09 Zoom] || [https://t.me/joinchat/HdCek9Q8tps_Ahnd Чат] || https://yadi.sk/d/51onIvR2Kgfh3w?w=1 || hveLQjj
+
| ИАД-4 || Кузнецов Максим || Саночкин Юрий || [https://zoom.us/j/95689153191?pwd=REp2R1hKcmFXRk9CTUxxRTFjRjFZUT09 Zoom] || [https://t.me/joinchat/HdCek9Q8tps_Ahnd Чат] || https://yadi.sk/d/51onIvR2Kgfh3w?w=1 || gsf6Xv2
 
|-
 
|-
 
| ИАД-5 || Гущин Михаил || Шикунов Николай || [https://zoom.us/j/92054171282?pwd=NXB3aHlMQlJ1dmpwN1EzQlNOenRzdz09 Zoom] || [https://t.me/joinchat/IsEjn93CrYbSbUyM Чат] || || Ksh1OIm
 
| ИАД-5 || Гущин Михаил || Шикунов Николай || [https://zoom.us/j/92054171282?pwd=NXB3aHlMQlJ1dmpwN1EzQlNOenRzdz09 Zoom] || [https://t.me/joinchat/IsEjn93CrYbSbUyM Чат] || || Ksh1OIm
Строка 74: Строка 74:
  
 
'''Лекция 2''' (04.02.2021). Вариационные автокодировщики. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture02-vae.pdf Слайды]] [[https://www.youtube.com/watch?v=cBL7jS4GQRk Запись лекции]]
 
'''Лекция 2''' (04.02.2021). Вариационные автокодировщики. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture02-vae.pdf Слайды]] [[https://www.youtube.com/watch?v=cBL7jS4GQRk Запись лекции]]
 +
 +
'''Лекция 3''' (11.02.2021). Генеративно-состязательные сети. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture03-gan.pdf Слайды]] [[https://youtu.be/lUNCZlM5SYY Запись лекции]]
 +
 +
'''Лекция 4''' (18.02.2021). Нормализационные потоки. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture04-nf.pdf Слайды]] [[https://www.youtube.com/watch?v=gpv7kf1bf-U Запись лекции]]
 +
 +
'''Лекция 5''' (25.02.2021). Диалоговые и вопросно-ответные системы. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture05.pdf Слайды]] [[https://youtu.be/TmVIGWzaq5A Запись лекции]]
 +
 +
'''Лекция 6''' (04.03.2021). DL для звука 1. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture06.pdf Слайды]] [[https://youtu.be/m4Ve26DNNyM Запись лекции]]
 +
 +
'''Лекция 7''' (11.03.2021). DL для звука 2. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/lectures/lecture07.pdf Слайды]] [[https://youtu.be/Rc9qUb7kdkQ Запись лекции]]
  
 
== Семинары ==
 
== Семинары ==
Строка 79: Строка 89:
 
'''Семинар 1''' (04.02.2021). Трансформация изображений. [[https://github.com/hse-ds/iad-applied-ds/tree/master/2021/seminars Тетрадка]]
 
'''Семинар 1''' (04.02.2021). Трансформация изображений. [[https://github.com/hse-ds/iad-applied-ds/tree/master/2021/seminars Тетрадка]]
  
 +
'''Семинар 2''' (11.02.2021). Вариационные автокодировщики. [[https://github.com/hse-ds/iad-applied-ds/tree/master/2021/seminars/sem02_ae_vae Тетрадка]]
 +
 +
'''Семинар 3''' (18.02.2021). Генеративно-состязательные сети. [[https://colab.research.google.com/github/hse-ds/iad-applied-ds/blob/master/2021/seminars/sem03_gan.ipynb Тетрадка]]
 +
 +
'''Семинар 4''' (25.02.2021). Нормализационные потоки. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/seminars/sem04_nf.ipynb Тетрадка]]
 +
 +
'''Семинар 5''' (04.03.2021). NER и лингвомодели. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/seminars/sem05_NER.ipynb Тетрадка]]
 +
 +
'''Семинар 6''' (11.03.2021). Распознавание речи. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/seminars/sem06_audio.ipynb Тетрадка]]
 +
 +
'''Семинар 7''' (18.03.2021). Генерация звука. [[https://github.com/hse-ds/iad-applied-ds/blob/master/2021/seminars/sem07_audio_gen.ipynb Тетрадка]]
 
== Практические задания ==
 
== Практические задания ==
  
 
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. В течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).
 
За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. В течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).
 +
 +
===Задание 1. Генеративные модели===
 +
Вам предстоит применить генеративно-состязательные сети и вариационный автокодировщик для быстрой симуляции параметров изображений системы двух черенковских телескопов MAGIC (Major Atmospheric Gamma Imaging Cherenkov).
 +
 +
'''Мягкий дедлайн''':  11 марта 2021 года 23:59
 +
 +
'''Дедлайн''':  14 марта 2021 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/iad-applied-ds/tree/master/2021/hw/hw1
 +
 +
===Задание 2. Deep learning для обработки звука===
 +
В этом задании Вы поработаете и разберетесь в деталях с форматами представления аудиоданных в задачах глубинного обучения, а так же напишете несколько моделей для классификации аудиозаписей.
 +
 +
В процессе выполнения Вы познакомитесь:
 +
* С алгоритмом построения Мел-спектрограммы.
 +
* Рекуррентными и сверточными классификаторами аудиоданных.
 +
* Алгоритмом аугментации аудиоданных SpecAugment.
 +
 +
'''Мягкий дедлайн''':  11 апреля 2021 года 23:59
 +
 +
'''Дедлайн''':  14 апреля 2021 года 23:59
 +
 +
'''Ссылка''': https://github.com/hse-ds/iad-applied-ds/tree/master/2021/hw/hw2
  
 
== Контрольная работа ==
 
== Контрольная работа ==

Версия 11:43, 8 апреля 2021

О курсе

Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.

Проводится с 2016 года.

Лекции проходят по четвергам в 11:10 по ссылке.

Полезные ссылки

Карточка курса и программа

Репозиторий с материалами на GitHub

Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)

Канал в telegram для объявлений: https://t.me/hse_minor_intro_dm_2

Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы): https://t.me/iad_flood

Ссылка на курс в Anytask: https://anytask.org/course/787

Таблица с оценками:

Семинары

Группа Преподаватель Учебный ассистент Zoom-конференция Ссылка на чат Материалы семинаров Инвайт в anytask
ИАД-1 Ковалёв Алексей Вертеева Алена Zoom Чат AclUusP
ИАД-2 Гущин Михаил Пащенко Анатолий Zoom Чат 1nkqLLM
ИАД-3 Чесаков Даниил Ревина Полина Zoom Чат https://github.com/Danyache/minor2021-iad3-spring xAWTEmD
ИАД-4 Кузнецов Максим Саночкин Юрий Zoom Чат https://yadi.sk/d/51onIvR2Kgfh3w?w=1 gsf6Xv2
ИАД-5 Гущин Михаил Шикунов Николай Zoom Чат Ksh1OIm
ИАД-6 Кантонистова Елена Цю-жен-цин Дмитрий Zoom Чат PHWSB7H

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Практические домашние работы на Python
  • Контрольная где-то в середине курса
  • Письменный экзамен

Итоговая оценка вычисляется по формуле:

Округление(0.5 * ДЗ + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

КР — оценка за контрольную работу

Э — оценка за экзамен

Итоговое округление арифметическое.

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Лекция 1 (28.01.2021). Задачи порождения изображений. Perceptual loss. Перенос стиля. Superresolution. [Слайды] [Запись лекции]

Лекция 2 (04.02.2021). Вариационные автокодировщики. [Слайды] [Запись лекции]

Лекция 3 (11.02.2021). Генеративно-состязательные сети. [Слайды] [Запись лекции]

Лекция 4 (18.02.2021). Нормализационные потоки. [Слайды] [Запись лекции]

Лекция 5 (25.02.2021). Диалоговые и вопросно-ответные системы. [Слайды] [Запись лекции]

Лекция 6 (04.03.2021). DL для звука 1. [Слайды] [Запись лекции]

Лекция 7 (11.03.2021). DL для звука 2. [Слайды] [Запись лекции]

Семинары

Семинар 1 (04.02.2021). Трансформация изображений. [Тетрадка]

Семинар 2 (11.02.2021). Вариационные автокодировщики. [Тетрадка]

Семинар 3 (18.02.2021). Генеративно-состязательные сети. [Тетрадка]

Семинар 4 (25.02.2021). Нормализационные потоки. [Тетрадка]

Семинар 5 (04.03.2021). NER и лингвомодели. [Тетрадка]

Семинар 6 (11.03.2021). Распознавание речи. [Тетрадка]

Семинар 7 (18.03.2021). Генерация звука. [Тетрадка]

Практические задания

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. В течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).

Задание 1. Генеративные модели

Вам предстоит применить генеративно-состязательные сети и вариационный автокодировщик для быстрой симуляции параметров изображений системы двух черенковских телескопов MAGIC (Major Atmospheric Gamma Imaging Cherenkov).

Мягкий дедлайн: 11 марта 2021 года 23:59

Дедлайн: 14 марта 2021 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2021/hw/hw1

Задание 2. Deep learning для обработки звука

В этом задании Вы поработаете и разберетесь в деталях с форматами представления аудиоданных в задачах глубинного обучения, а так же напишете несколько моделей для классификации аудиозаписей.

В процессе выполнения Вы познакомитесь:

  • С алгоритмом построения Мел-спектрограммы.
  • Рекуррентными и сверточными классификаторами аудиоданных.
  • Алгоритмом аугментации аудиоданных SpecAugment.

Мягкий дедлайн: 11 апреля 2021 года 23:59

Дедлайн: 14 апреля 2021 года 23:59

Ссылка: https://github.com/hse-ds/iad-applied-ds/tree/master/2021/hw/hw2

Контрольная работа

Экзамен

Страницы прошлых лет

2019/20 учебный год

2018/19 учебный год

2017/18 учебный год

2016/17 учебный год