Автоматический анализ текстов-2021-2022

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс проходит в смешанном формате: Курс на OpenEdu и 9 вебинаров

Ссылка на Zoom (по понедельникам в 19:00): [Weekly Zoom Meeting Link]

Контакты

Канал в TG: NLP channel link

Чат курса в TG: NLP chat link

Преподаватель Контакты
Артёмова Екатерина Telegram
Вероника Саркисян Telegram
Михаил Флоринский Telegram

Материалы курса

Ссылка на плейлист курса на YouTube: https://www.youtube.com/playlist?list=PLmA-1xX7IuzB0hk1DjnaF6YapLrNkDFN4

Ссылка на github с материалами курса: [GitHub]

Ссылка на курс на платформе OpenEdu: https://openedu.ru/course/hse/TEXT/?session=fall_2020

Неделя Тема Материалы для подготовки к семинару Дополнительные материалы
1 Регулярки. Техники предобработки текстов. Простые векторные модели Блок "Введение в анализ текстов, базовые методы предобработки и выделения признаков" на OpenEdu
2 Векторные представления слов: берем предобученные // обучаем сами // дообучаем :) Блок "Неглубокие векторные представления слов" на OpenEdu, ноутбук "Векторные представления слов"
3 Классификация текста с использованием FastText и CNN. Аугментация текстовых данных: Under- and Oversampling Блок "Классификация текстов" с OpenEdu, Ноутбук про классификацию текстов, итоговый тест к блоку "Неглубокие векторные представления слов" с OpenEdu Найти в корпусе lenta.ru все имена людей (Подсказка: регулярки и морфологический парсинг)
4 Языковые модели и генерация текстов. Вероятностные модели и RNN-ки
5 Seq2Seq-модели, механизм Attention Kaggle занятия
6 Бенчмарки. GLUE и обучение на его примерах Ноутбук
7 Классификация текстов BERT'ом Домашнее задание на OpenEdu или Соревнование на Kaggle про поиск упоминания побочек в твитах
8 Семинар "Как сравнивать модели?"

Оценки

Oитог = 0.3 * Отесты + 0.7 * Одз

[Ведомость]