МОВС Deep learning для обработки звука (2022) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
м (add lect 2 link) |
м (final UPD) |
||
Строка 21: | Строка 21: | ||
==Материалы курса== | ==Материалы курса== | ||
Ссылка на плейлист курса на YouTube: [https://www.youtube.com/playlist?list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN YouTube playlist] | Ссылка на плейлист курса на YouTube: [https://www.youtube.com/playlist?list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN YouTube playlist] | ||
− | |||
− | |||
{| class="wikitable" | {| class="wikitable" | ||
Строка 30: | Строка 28: | ||
| style="background:#eaecf0;" | '''1''' [[https://www.youtube.com/watch?v=M9Ax_ZmWulE&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || Введение. Рассказ про приложения DL для звука. Диаризация || 10.11.22 || || | | style="background:#eaecf0;" | '''1''' [[https://www.youtube.com/watch?v=M9Ax_ZmWulE&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || Введение. Рассказ про приложения DL для звука. Диаризация || 10.11.22 || || | ||
|- | |- | ||
− | | style="background:#eaecf0;" | '''2''' [[https://www.youtube.com/watch?v=uc7GeIN-qFQ&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[ Ноутбук]] Text-to-Speech 1 || 17.11.22 || [https://www.youtube.com/watch?v=eW69GxM2_pY&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция]|| [https://www.youtube.com/watch?v=mNkwO8f3Edk Семинар с KWS (начало видео)], в конце видео описание домашки, похожей на ту, что мы выдадим | + | | style="background:#eaecf0;" | '''2''' [[https://www.youtube.com/watch?v=uc7GeIN-qFQ&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[ Ноутбук]] Text-to-Speech 1 || 17.11.22 || [https://www.youtube.com/watch?v=eW69GxM2_pY&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция]|| [https://www.youtube.com/watch?v=mNkwO8f3Edk Семинар с KWS (начало видео)], в конце видео описание домашки, похожей на ту, что мы выдадим; [[https://t.me/c/1466085420/8 Ноутбук с семинара]] |
|- | |- | ||
− | | style="background:#eaecf0;" | '''3''' | + | | style="background:#eaecf0;" | '''3''' [[https://www.youtube.com/watch?v=szjJtvp_4Nw&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || Text-to-Speech 2 || 24.11.22 || [https://www.youtube.com/watch?v=5Cz3wjQ3Eac Лекция]|| |
|- | |- | ||
− | | style="background:#eaecf0;" | '''4''' || [[ | + | | style="background:#eaecf0;" | '''4''' [[https://www.youtube.com/watch?v=sf4WGQnZ8Oo&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]] || [[https://github.com/sovse/tutorial_wav2vec2 Ноутбук]] Automatic Speech Recognition 1 || 01.12.22 || [https://www.youtube.com/watch?v=uzXU4Cazn0c&list=PLEwK9wdS5g0oE9htlwY-WarI5_jeH818j Лекция] || |
|- | |- | ||
− | | style="background:#eaecf0;" | '''5''' | + | | style="background:#eaecf0;" | '''5''' [[https://www.youtube.com/watch?v=jFGV56bJRtM&list=PLmA-1xX7IuzCAIYLfBdGu07s4p7qpQtVN Запись]]|| Automatic Speech Recognition 2 || 08.12.22 || || |
|- | |- | ||
|} | |} | ||
Строка 43: | Строка 41: | ||
Оценка = 0.3*О<sub>тесты</sub> + 0.7*О<sub>ДЗ</sub> | Оценка = 0.3*О<sub>тесты</sub> + 0.7*О<sub>ДЗ</sub> | ||
+ | |||
+ | Тесты: | ||
+ | 1. [https://forms.gle/QTakAR3pUMeN1JPa7 TTS] | ||
+ | 2. [https://docs.google.com/forms/d/e/1FAIpQLSdtr5jcJkZyJ30LJlAnbEwSbq6gRhY2X7QdskaWX1mf5R8q8Q/viewform?usp=sf_link ASR] | ||
== Домашние задания == | == Домашние задания == | ||
− | * | + | * [https://github.com/markovka17/dla/tree/2021/hw2_kws KWS]: семинар с базовой моделью ([https://github.com/markovka17/dla/blob/2021/week06/seminar.ipynb тык]), дедлайн - '''04.12.22 23:59''' |
− | * | + | * ASR: [https://t.me/c/1466085420/22 описание], [https://t.me/c/1466085420/20 датасеты], [https://disk.yandex.ru/d/nhehWn4uS7UKjA корпус русских текстов для языковой модели ASR]; '''дедлайн - 20.12.22 23:59''' |
== Литература == | == Литература == | ||
* [https://slazebni.cs.illinois.edu/spring17/lec26_audio.pdf Презентация из университета Иллинойса] | * [https://slazebni.cs.illinois.edu/spring17/lec26_audio.pdf Презентация из университета Иллинойса] | ||
* [https://arxiv.org/pdf/1905.00078.pdf Обзорная статья in Journal of Selected Topics of Signal Processing] | * [https://arxiv.org/pdf/1905.00078.pdf Обзорная статья in Journal of Selected Topics of Signal Processing] |
Версия 18:50, 8 января 2023
Содержание
О курсе
Занятия проводятся в Zoom по четвергам в 19:00
Контакты
Канал курса в TG: channel link
Чат курса в TG: chat link
Преподаватели: Шабалин Евгений, Парков Андрей
Ассистент | Контакты |
---|---|
Илья Анищенко | @poly_nomial |
Материалы курса
Ссылка на плейлист курса на YouTube: YouTube playlist
Занятие | Тема | Дата | Материалы для самоподготовки к семинарам | Дополнительные материалы |
---|---|---|---|---|
1 [Запись] | Введение. Рассказ про приложения DL для звука. Диаризация | 10.11.22 | ||
2 [Запись] | Ноутбук Text-to-Speech 1 | 17.11.22 | Лекция | Семинар с KWS (начало видео), в конце видео описание домашки, похожей на ту, что мы выдадим; [Ноутбук с семинара] |
3 [Запись] | Text-to-Speech 2 | 24.11.22 | Лекция | |
4 [Запись] | [Ноутбук] Automatic Speech Recognition 1 | 01.12.22 | Лекция | |
5 [Запись] | Automatic Speech Recognition 2 | 08.12.22 |
Формула оценивания
Оценка = 0.3*Отесты + 0.7*ОДЗ
Домашние задания
- KWS: семинар с базовой моделью (тык), дедлайн - 04.12.22 23:59
- ASR: описание, датасеты, корпус русских текстов для языковой модели ASR; дедлайн - 20.12.22 23:59