Компьютерная лингвистика и информационные технологии 2020
О курсе
Курс читается для бакалавров 4-го курса факультета гуманитарных наук в 1-3 модулях.
Преподаватели:
Олег Сериков (Почта, Telegram ),
Мария Пономарева (Почта, Telegram ),
Влад Михайлов (Почта, Telegram )
Ассистенты: Кирилл Коновалов(Почта, Telegram ), Дарья Самсонова(Почта, Telegram )
Содержание учебной дисциплины
1. Предобработка данных
2. Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии
3. Избранные главы математики для машинного обучения
4. FFN, CNN, RNN, LSTM
5. Sequence-to-sequence, Sequence Tagging, Language Modeling
6. Статические эмбеддинги (Word2Vec, FastText)
7. Контекстуальные эмбеддинги (BERT, ELMo)
Формула оценки
0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Экзамен (Модуль 2) + 0.2 * Экзамен (Модуль 3)