МОВС Deep learning для обработки звука (2022)

Содержание

Занятия проводятся в Zoom по четвергам в 19:00

Канал курса в TG: channel link

Чат курса в TG: chat link

Преподаватели: Шабалин Евгений, Парков Андрей

Ассистент	Контакты
Илья Анищенко	@poly_nomial

Ссылка на плейлист курса на YouTube: YouTube playlist

Занятие	Тема	Дата	Материалы для самоподготовки к семинарам	Дополнительные материалы
1 [Запись]	Введение. Рассказ про приложения DL для звука. Диаризация	10.11.22
2 [Запись]	Ноутбук Text-to-Speech 1	17.11.22	Лекция	Семинар с KWS (начало видео), в конце видео описание домашки, похожей на ту, что мы выдадим; [Ноутбук с семинара]
3 [Запись]	Text-to-Speech 2	24.11.22	Лекция
4 [Запись]	[Ноутбук] Automatic Speech Recognition 1	01.12.22	Лекция
5 [Запись]	Automatic Speech Recognition 2	08.12.22

Оценка = 0.3*О_тесты + 0.7*О_ДЗ

Тесты: 1. TTS 2. ASR

KWS: семинар с базовой моделью (тык), дедлайн - 04.12.22 23:59
ASR: описание, датасеты, корпус русских текстов для языковой модели ASR; дедлайн - 20.12.22 23:59