МОВС Deep learning для обработки звука (2022) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (add lect 2 link)
м (final UPD)
Строка 21: Строка 21:
 
==Материалы курса==
 
==Материалы курса==
 
Ссылка на плейлист курса на YouTube: [https://www.youtube.com/playlist?list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN YouTube playlist]
 
Ссылка на плейлист курса на YouTube: [https://www.youtube.com/playlist?list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN YouTube playlist]
 
Ссылка на GitHub с материалами курса: [[ GitHub repository]]
 
  
 
{| class="wikitable"
 
{| class="wikitable"
Строка 30: Строка 28:
 
| style="background:#eaecf0;" | '''1''' [[https://www.youtube.com/watch?v=M9Ax_ZmWulE&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] ||  Введение. Рассказ про приложения DL для звука. Диаризация || 10.11.22 || ||  
 
| style="background:#eaecf0;" | '''1''' [[https://www.youtube.com/watch?v=M9Ax_ZmWulE&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] ||  Введение. Рассказ про приложения DL для звука. Диаризация || 10.11.22 || ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''2''' [[https://www.youtube.com/watch?v=uc7GeIN-qFQ&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[ Ноутбук]] Text-to-Speech 1 || 17.11.22 || [https://www.youtube.com/watch?v=eW69GxM2_pY&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция]|| [https://www.youtube.com/watch?v=mNkwO8f3Edk Семинар с KWS (начало видео)], в конце видео описание домашки, похожей на ту, что мы выдадим
+
| style="background:#eaecf0;" | '''2''' [[https://www.youtube.com/watch?v=uc7GeIN-qFQ&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[ Ноутбук]] Text-to-Speech 1 || 17.11.22 || [https://www.youtube.com/watch?v=eW69GxM2_pY&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция]|| [https://www.youtube.com/watch?v=mNkwO8f3Edk Семинар с KWS (начало видео)], в конце видео описание домашки, похожей на ту, что мы выдадим; [[https://t.me/c/1466085420/8 Ноутбук с семинара]]
 
|-
 
|-
| style="background:#eaecf0;" | '''3''' || [[ Запись]] Text-to-Speech 2 || 24.11.22 || ||
+
| style="background:#eaecf0;" | '''3''' [[https://www.youtube.com/watch?v=szjJtvp_4Nw&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] ||  Text-to-Speech 2 || 24.11.22 || [https://www.youtube.com/watch?v=5Cz3wjQ3Eac Лекция]||
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' || [[ Запись]] Autonomous Speech Recognition 1 || 01.12.22 || ||  
+
| style="background:#eaecf0;" | '''4''' [[https://www.youtube.com/watch?v=sf4WGQnZ8Oo&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[https://github.com/sovse/tutorial_wav2vec2 Ноутбук]] Automatic Speech Recognition 1 || 01.12.22 || [https://www.youtube.com/watch?v=uzXU4Cazn0c&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция] ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''5''' || [[ Запись]] Autonomous Speech Recognition 2 || 08.12.22 || ||  
+
| style="background:#eaecf0;" | '''5''' [[https://www.youtube.com/watch?v=jFGV56bJRtM&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]]|| Automatic Speech Recognition 2 || 08.12.22 || ||  
 
|-
 
|-
 
|}
 
|}
Строка 43: Строка 41:
  
 
Оценка = 0.3*О<sub>тесты</sub> + 0.7*О<sub>ДЗ</sub>
 
Оценка = 0.3*О<sub>тесты</sub> + 0.7*О<sub>ДЗ</sub>
 +
 +
Тесты:
 +
1. [https://forms.gle/QTakAR3pUMeN1JPa7 TTS]
 +
2. [https://docs.google.com/forms/d/e/1FAIpQLSdtr5jcJkZyJ30LJlAnbEwSbq6gRhY2X7QdskaWX1mf5R8q8Q/viewform?usp=sf_link ASR]
  
 
== Домашние задания ==
 
== Домашние задания ==
* Раз
+
* [https://github.com/markovka17/dla/tree/2021/hw2_kws KWS]: семинар с базовой моделью ([https://github.com/markovka17/dla/blob/2021/week06/seminar.ipynb тык]), дедлайн - '''04.12.22 23:59'''
* Два
+
* ASR: [https://t.me/c/1466085420/22 описание], [https://t.me/c/1466085420/20 датасеты], [https://disk.yandex.ru/d/nhehWn4uS7UKjA корпус русских текстов для языковой модели ASR]; '''дедлайн - 20.12.22 23:59'''
  
 
== Литература ==
 
== Литература ==
 
* [https://slazebni.cs.illinois.edu/spring17/lec26_audio.pdf Презентация из университета Иллинойса]
 
* [https://slazebni.cs.illinois.edu/spring17/lec26_audio.pdf Презентация из университета Иллинойса]
 
* [https://arxiv.org/pdf/1905.00078.pdf Обзорная статья in Journal of Selected Topics of Signal Processing]
 
* [https://arxiv.org/pdf/1905.00078.pdf Обзорная статья in Journal of Selected Topics of Signal Processing]

Версия 18:50, 8 января 2023

О курсе

Занятия проводятся в Zoom по четвергам в 19:00

Контакты

Канал курса в TG: channel link

Чат курса в TG: chat link

Преподаватели: Шабалин Евгений, Парков Андрей

Ассистент Контакты
Илья Анищенко @poly_nomial

Материалы курса

Ссылка на плейлист курса на YouTube: YouTube playlist

Занятие Тема Дата Материалы для самоподготовки к семинарам Дополнительные материалы
1 [Запись] Введение. Рассказ про приложения DL для звука. Диаризация 10.11.22
2 [Запись] Ноутбук Text-to-Speech 1 17.11.22 Лекция Семинар с KWS (начало видео), в конце видео описание домашки, похожей на ту, что мы выдадим; [Ноутбук с семинара]
3 [Запись] Text-to-Speech 2 24.11.22 Лекция
4 [Запись] [Ноутбук] Automatic Speech Recognition 1 01.12.22 Лекция
5 [Запись] Automatic Speech Recognition 2 08.12.22

Формула оценивания

Оценка = 0.3*Отесты + 0.7*ОДЗ

Тесты: 1. TTS 2. ASR

Домашние задания

Литература