МОВС Автоматический анализ текстов (2022)
Материал из Wiki - Факультет компьютерных наук
Содержание
О курсе
Занятия проводятся в [Zoom] по средам в 19:00
Онлайн-курс в дополнение к парам: [online-course link]
Контакты
Канал курса в TG: channel link
Чат курса в TG: chat link
Преподаватели: Саркисян Вероника, Аксенов Сергей
Ассистент | Контакты |
---|---|
Илья Никитин | @is_nikitin |
Материалы курса
Ссылка на плейлист курса на YouTube: YouTube playlist
Ссылка на GitHub с материалами курса: [GitHub repository]
Занятие | Тема | Дата | Материалы для самоподготовки к семинарам | Дополнительные материалы |
---|---|---|---|---|
1 [Запись] | [Материалы] Регулярные выражения. Preprocessing. Простые векторные модели. | 09.11.22 | ||
2 [Запись] | [Ноутбук] Векторные представления слов: Genism, GloVe, fastText. Обучение своей word2vec//fastText модели. Дообучение. | 16.11.22 | ||
3 [Запись] | [Ноутбук] Классификация текста с использованием FastText и CNN | 23.11.22 | ||
4 [Запись] | [Ноутбук] Языковые модели и генерация текста | 30.11.22 | ||
5 [Запись] | [Ноутбук] seq2seq-модели, механизм внимания | 07.12.22 | ||
6 | Запись | 14.12.22 |
Формула оценивания
Оценка = 0.4*Отесты на онлайн-платформе + 0.3*ОДЗ-1 + 0.3*ОДЗ-2
Обязательные только тесты по разделам 2-8 (включительно). В оценку входят только итоговые тесты.
Форма для сдачи скриншота с результатами тестов на платформе
Домашние задания
- Kaggle-соревнование "Toxic comments classification", дедлайн - 17.12.22 23:59 | Для сдачи нужно прислать ноутбук на impecopeco@gmail.com (в теме указать ФИО и ник на Kaggle)
- NER, дедлайн - 27.12.2022 в 23:59 | Инвайт в Энитаск: BqXqcTy
Литература
- Jurafsky, Martin. Speech and Language Processing - online book
- Rothman. Transformers for Natural Language Processing
- Материалы NLP курса от DeepPavlov
- Репозиторий курса NLP в ШАДе