Компьютерная лингвистика и информационные технологии 2020

Материал из Wiki - Факультет компьютерных наук
Версия от 19:13, 26 августа 2020; MashPo (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

О курсе

Курс читается для бакалавров 4-го курса факультета гуманитарных наук в 1-3 модулях.


Преподаватели: Олег Сериков (Почта, Telegram ), Мария Пономарева (Почта, Telegram ), Влад Михайлов (Почта, Telegram )


Ассистенты: Кирилл Коновалов(Почта, Telegram ), Дарья Самсонова(Почта, Telegram )


Содержание учебной дисциплины

1. Предобработка данных

2. Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии

3. Избранные главы математики для машинного обучения

4. FFN, CNN, RNN, LSTM

5. Sequence-to-sequence, Sequence Tagging, Language Modeling

6. Статические эмбеддинги (Word2Vec, FastText)

7. Контекстуальные эмбеддинги (BERT, ELMo)


Формула оценки

0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Экзамен (Модуль 2) + 0.2 * Экзамен (Модуль 3)