МОВС Deep learning для обработки звука (2022) — различия между версиями

Версия 18:50, 8 января 2023

Содержание

1 О курсе
2 Контакты
3 Материалы курса
4 Формула оценивания
5 Домашние задания
6 Литература

О курсе

Занятия проводятся в Zoom по четвергам в 19:00

Контакты

Канал курса в TG: channel link

Чат курса в TG: chat link

Преподаватели: Шабалин Евгений, Парков Андрей

Ассистент	Контакты
Илья Анищенко	@poly_nomial

Материалы курса

Ссылка на плейлист курса на YouTube: YouTube playlist

Занятие	Тема	Дата	Материалы для самоподготовки к семинарам	Дополнительные материалы
1 [Запись]	Введение. Рассказ про приложения DL для звука. Диаризация	10.11.22
2 [Запись]	Ноутбук Text-to-Speech 1	17.11.22	Лекция	Семинар с KWS (начало видео), в конце видео описание домашки, похожей на ту, что мы выдадим; [Ноутбук с семинара]
3 [Запись]	Text-to-Speech 2	24.11.22	Лекция
4 [Запись]	[Ноутбук] Automatic Speech Recognition 1	01.12.22	Лекция
5 [Запись]	Automatic Speech Recognition 2	08.12.22

Формула оценивания

Оценка = 0.3*О_тесты + 0.7*О_ДЗ

Тесты: 1. TTS 2. ASR

Домашние задания

KWS: семинар с базовой моделью (тык), дедлайн - 04.12.22 23:59
ASR: описание, датасеты, корпус русских текстов для языковой модели ASR; дедлайн - 20.12.22 23:59

@@ Строка 21: / Строка 21: @@
 ==Материалы курса==
 Ссылка на плейлист курса на YouTube: [https://www.youtube.com/playlist?list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN YouTube playlist]
-Ссылка на GitHub с материалами курса: [[ GitHub repository]]
 {| class="wikitable"
@@ Строка 30: / Строка 28: @@
 | style="background:#eaecf0;" | '''1''' [[https://www.youtube.com/watch?v=M9Ax_ZmWulE&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] ||  Введение. Рассказ про приложения DL для звука. Диаризация || 10.11.22 || ||
 |-
-| style="background:#eaecf0;" | '''2''' [[https://www.youtube.com/watch?v=uc7GeIN-qFQ&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[ Ноутбук]] Text-to-Speech 1 || 17.11.22 || [https://www.youtube.com/watch?v=eW69GxM2_pY&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция]|| [https://www.youtube.com/watch?v=mNkwO8f3Edk Семинар с KWS (начало видео)], в конце видео описание домашки, похожей на ту, что мы выдадим
+| style="background:#eaecf0;" | '''2''' [[https://www.youtube.com/watch?v=uc7GeIN-qFQ&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[ Ноутбук]] Text-to-Speech 1 || 17.11.22 || [https://www.youtube.com/watch?v=eW69GxM2_pY&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция]|| [https://www.youtube.com/watch?v=mNkwO8f3Edk Семинар с KWS (начало видео)], в конце видео описание домашки, похожей на ту, что мы выдадим; [[https://t.me/c/1466085420/8 Ноутбук с семинара]]
 |-
-| style="background:#eaecf0;" | '''3''' || [[ Запись]] Text-to-Speech 2 || 24.11.22 || ||
+| style="background:#eaecf0;" | '''3''' [[https://www.youtube.com/watch?v=szjJtvp_4Nw&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] ||  Text-to-Speech 2 || 24.11.22 || [https://www.youtube.com/watch?v=5Cz3wjQ3Eac Лекция]||
 |-
-| style="background:#eaecf0;" | '''4''' || [[ Запись]] Autonomous Speech Recognition 1 || 01.12.22 || ||
+| style="background:#eaecf0;" | '''4''' [[https://www.youtube.com/watch?v=sf4WGQnZ8Oo&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[https://github.com/sovse/tutorial_wav2vec2 Ноутбук]] Automatic Speech Recognition 1 || 01.12.22 || [https://www.youtube.com/watch?v=uzXU4Cazn0c&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция] ||
 |-
-| style="background:#eaecf0;" | '''5''' || [[ Запись]] Autonomous Speech Recognition 2 || 08.12.22 || ||
+| style="background:#eaecf0;" | '''5''' [[https://www.youtube.com/watch?v=jFGV56bJRtM&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]]|| Automatic Speech Recognition 2 || 08.12.22 || ||
 |-
 |}
@@ Строка 43: / Строка 41: @@
 Оценка = 0.3*О<sub>тесты</sub> + 0.7*О<sub>ДЗ</sub>
+Тесты:
+. [https://forms.gle/QTakAR3pUMeN1JPa7 TTS]
+. [https://docs.google.com/forms/d/e/1FAIpQLSdtr5jcJkZyJ30LJlAnbEwSbq6gRhY2X7QdskaWX1mf5R8q8Q/viewform?usp=sf_link ASR]
 == Домашние задания ==
-* Раз
+* [https://github.com/markovka17/dla/tree/2021/hw2_kws KWS]: семинар с базовой моделью ([https://github.com/markovka17/dla/blob/2021/week06/seminar.ipynb тык]), дедлайн - '''04.12.22 23:59'''
-* Два
+* ASR: [https://t.me/c/1466085420/22 описание], [https://t.me/c/1466085420/20 датасеты], [https://disk.yandex.ru/d/nhehWn4uS7UKjA корпус русских текстов для языковой модели ASR]; '''дедлайн - 20.12.22 23:59'''
 == Литература ==
 * [https://slazebni.cs.illinois.edu/spring17/lec26_audio.pdf Презентация из университета Иллинойса]
 * [https://arxiv.org/pdf/1905.00078.pdf Обзорная статья in Journal of Selected Topics of Signal Processing]

МОВС Deep learning для обработки звука (2022) — различия между версиями

Версия 18:50, 8 января 2023

Содержание

О курсе

Контакты

Материалы курса

Формула оценивания

Домашние задания

Литература

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

Навигация

Инструменты