Компьютерная лингвистика и информационные технологии 2020 — различия между версиями
MashPo (обсуждение | вклад) (дубли убраны) |
MashPo (обсуждение | вклад) (добавлен Инфопоиск) |
||
Строка 4: | Строка 4: | ||
− | '''Преподаватели:''' | + | <big>'''Преподаватели:'''</big> |
+ | * блок Информационный поиск: | ||
+ | |||
+ | Дроздова Ксения Андреевна ([https://t.me/ksdrozdova Telegram ]) | ||
+ | |||
+ | |||
+ | * блок Компьютерная лингвистика: | ||
+ | |||
Олег Сериков ([mailto:srkvoa@gmail.com Почта], [https://t.me/oserikov Telegram ]), | Олег Сериков ([mailto:srkvoa@gmail.com Почта], [https://t.me/oserikov Telegram ]), | ||
Мария Пономарева ([mailto:ponomarevamawa@gmail.com Почта], [https://t.me/MashPo Telegram ]), | Мария Пономарева ([mailto:ponomarevamawa@gmail.com Почта], [https://t.me/MashPo Telegram ]), | ||
Строка 11: | Строка 18: | ||
− | '''Ассистенты:''' | + | <big>'''Ассистенты:'''</big> |
Кирилл Коновалов([mailto:konovalovkirill27@gmail.com Почта], [https://t.me/kirillknv Telegram ]), | Кирилл Коновалов([mailto:konovalovkirill27@gmail.com Почта], [https://t.me/kirillknv Telegram ]), | ||
Дарья Самсонова([mailto:daria2814@gmail.com Почта], [https://t.me/SamsonovaDaria Telegram ]) | Дарья Самсонова([mailto:daria2814@gmail.com Почта], [https://t.me/SamsonovaDaria Telegram ]) | ||
Строка 17: | Строка 24: | ||
== Содержание учебной дисциплины == | == Содержание учебной дисциплины == | ||
− | + | * Блок “Информационный поиск“ | |
− | + | ** Введение в информационный поиск, булев поиск, обратный индекс, Okapi BM25, семантический поиск, векторные модели, модель выделения корня слова, основанная на RNN, логирование, добавление в поисковик | |
− | + | ||
− | + | * Блок “Компьютерная лингвистика“ | |
− | + | ** Предобработка данных | |
− | + | ** Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии | |
− | + | ** Избранные главы математики для машинного обучения | |
+ | ** FFN, CNN, RNN, LSTM | ||
+ | ** Sequence-to-sequence, Sequence Tagging, Language Modeling | ||
+ | ** Статические эмбеддинги (Word2Vec, FastText) | ||
+ | ** Контекстуальные эмбеддинги (BERT, ELMo) | ||
==Формула оценки== | ==Формула оценки== | ||
− | 0.5 * Домашние задания + 0.1 * Тесты + 0.2 * | + | '''Промежуточная аттестация (1 модуль)''' |
+ | |||
+ | 0.5 * Блок “Информационный поиск” + 0.5 * Блок “Компьютерная лингвистика”: | ||
+ | |||
+ | Блок “Информационный поиск”: 0.7 * Домашние задания + 0.3 * Экзамен (Модуль 1) | ||
+ | |||
+ | Блок “Компьютерная лингвистика”: 0.8 * Домашние задания + 0.2 * Тесты | ||
+ | |||
+ | '''Промежуточная аттестация (3 модуль)''' | ||
+ | |||
+ | 0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Промежуточный контроль (Модуль 2) + 0.2 * Экзамен (Модуль 3) | ||
+ | |||
==Рекомендованная литература== | ==Рекомендованная литература== |
Версия 00:30, 4 сентября 2020
О курсе
Курс читается для бакалавров 4-го курса ФГН в рамках программы "Фундаментальная и компьютерная лингвистика" в 1-3 модулях.
Преподаватели:
- блок Информационный поиск:
Дроздова Ксения Андреевна (Telegram )
- блок Компьютерная лингвистика:
Олег Сериков (Почта, Telegram ), Мария Пономарева (Почта, Telegram ), Влад Михайлов (Почта, Telegram )
Ассистенты: Кирилл Коновалов(Почта, Telegram ), Дарья Самсонова(Почта, Telegram )
Содержание учебной дисциплины
- Блок “Информационный поиск“
- Введение в информационный поиск, булев поиск, обратный индекс, Okapi BM25, семантический поиск, векторные модели, модель выделения корня слова, основанная на RNN, логирование, добавление в поисковик
- Блок “Компьютерная лингвистика“
- Предобработка данных
- Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии
- Избранные главы математики для машинного обучения
- FFN, CNN, RNN, LSTM
- Sequence-to-sequence, Sequence Tagging, Language Modeling
- Статические эмбеддинги (Word2Vec, FastText)
- Контекстуальные эмбеддинги (BERT, ELMo)
Формула оценки
Промежуточная аттестация (1 модуль)
0.5 * Блок “Информационный поиск” + 0.5 * Блок “Компьютерная лингвистика”:
Блок “Информационный поиск”: 0.7 * Домашние задания + 0.3 * Экзамен (Модуль 1)
Блок “Компьютерная лингвистика”: 0.8 * Домашние задания + 0.2 * Тесты
Промежуточная аттестация (3 модуль)
0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Промежуточный контроль (Модуль 2) + 0.2 * Экзамен (Модуль 3)
Рекомендованная литература
- Daniel Jurafsky & James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Third Edition. https://web.stanford.edu/~jurafsky/slp3/
- Николаев И.С., Митренина О.В., Ландо Т.М. (ред.) Прикладная и компьютерная лингвистика. Изд 2. URSS. 2017. 320 с.
- Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python. – Analyzing Text with the Natural Language Toolkit. https://www.nltk.org/book/
- Christopher D. Manning & Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999.
- Yoav Goldberg. Neural Network Methods for Natural Language Processing (Synthesis Lectures on Human Language Technologies). Edited by Graeme Hirst. Morgan & Claypool 2017
- Cборники конференций COLING, ACL, EACL, LREC, EMNLP, NAACL, "Диалог" последних лет