МОВС Deep learning для обработки звука (2022)
Материал из Wiki - Факультет компьютерных наук
Версия от 18:50, 8 января 2023; SavelyProkhorov (обсуждение | вклад)
Содержание
О курсе
Занятия проводятся в Zoom по четвергам в 19:00
Контакты
Канал курса в TG: channel link
Чат курса в TG: chat link
Преподаватели: Шабалин Евгений, Парков Андрей
Ассистент | Контакты |
---|---|
Илья Анищенко | @poly_nomial |
Материалы курса
Ссылка на плейлист курса на YouTube: YouTube playlist
Занятие | Тема | Дата | Материалы для самоподготовки к семинарам | Дополнительные материалы |
---|---|---|---|---|
1 [Запись] | Введение. Рассказ про приложения DL для звука. Диаризация | 10.11.22 | ||
2 [Запись] | Ноутбук Text-to-Speech 1 | 17.11.22 | Лекция | Семинар с KWS (начало видео), в конце видео описание домашки, похожей на ту, что мы выдадим; [Ноутбук с семинара] |
3 [Запись] | Text-to-Speech 2 | 24.11.22 | Лекция | |
4 [Запись] | [Ноутбук] Automatic Speech Recognition 1 | 01.12.22 | Лекция | |
5 [Запись] | Automatic Speech Recognition 2 | 08.12.22 |
Формула оценивания
Оценка = 0.3*Отесты + 0.7*ОДЗ
Домашние задания
- KWS: семинар с базовой моделью (тык), дедлайн - 04.12.22 23:59
- ASR: описание, датасеты, корпус русских текстов для языковой модели ASR; дедлайн - 20.12.22 23:59