Компьютерная лингвистика и информационные технологии 2020 — различия между версиями
MashPo (обсуждение | вклад) (добавлена информация о курсе и преподавателях) |
MashPo (обсуждение | вклад) (добавлен список литературы) |
||
Строка 1: | Строка 1: | ||
== О курсе == | == О курсе == | ||
− | Курс читается для бакалавров 4-го курса | + | Курс читается для бакалавров 4-го курса ФГН в рамках программы "Фундаментальная и компьютерная лингвистика" в 1-3 модулях. |
Строка 15: | Строка 15: | ||
Дарья Самсонова([mailto:daria2814@gmail.com Почта], [https://t.me/SamsonovaDaria Telegram ]) | Дарья Самсонова([mailto:daria2814@gmail.com Почта], [https://t.me/SamsonovaDaria Telegram ]) | ||
+ | |||
+ | == Содержание учебной дисциплины == | ||
+ | # Предобработка данных | ||
+ | # Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии | ||
+ | # Избранные главы математики для машинного обучения | ||
+ | # FFN, CNN, RNN, LSTM | ||
+ | # Sequence-to-sequence, Sequence Tagging, Language Modeling | ||
+ | # Статические эмбеддинги (Word2Vec, FastText) | ||
+ | # Контекстуальные эмбеддинги (BERT, ELMo) | ||
+ | |||
+ | |||
+ | ==Формула оценки== | ||
+ | 0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Экзамен (Модуль 2) + 0.2 * Экзамен (Модуль 3) | ||
+ | |||
+ | ==Рекомендованная литература== | ||
+ | # Daniel Jurafsky & James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Third Edition. https://web.stanford.edu/~jurafsky/slp3/ | ||
+ | # Николаев И.С., Митренина О.В., Ландо Т.М. (ред.) Прикладная и компьютерная лингвистика. Изд 2. URSS. 2017. 320 с. | ||
+ | # Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python. – Analyzing Text with the Natural Language Toolkit. https://www.nltk.org/book/ | ||
+ | # Christopher D. Manning & Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999. | ||
+ | # Yoav Goldberg. Neural Network Methods for Natural Language Processing (Synthesis Lectures on Human Language Technologies). Edited by Graeme Hirst. Morgan & Claypool 2017 | ||
+ | # Cборники конференций COLING, ACL, EACL, LREC, EMNLP, NAACL, "Диалог" последних лет | ||
== Содержание учебной дисциплины == | == Содержание учебной дисциплины == |
Версия 19:24, 26 августа 2020
Содержание
[убрать]О курсе
Курс читается для бакалавров 4-го курса ФГН в рамках программы "Фундаментальная и компьютерная лингвистика" в 1-3 модулях.
Преподаватели:
Олег Сериков (Почта, Telegram ),
Мария Пономарева (Почта, Telegram ),
Влад Михайлов (Почта, Telegram )
Ассистенты: Кирилл Коновалов(Почта, Telegram ), Дарья Самсонова(Почта, Telegram )
Содержание учебной дисциплины
- Предобработка данных
- Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии
- Избранные главы математики для машинного обучения
- FFN, CNN, RNN, LSTM
- Sequence-to-sequence, Sequence Tagging, Language Modeling
- Статические эмбеддинги (Word2Vec, FastText)
- Контекстуальные эмбеддинги (BERT, ELMo)
Формула оценки
0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Экзамен (Модуль 2) + 0.2 * Экзамен (Модуль 3)
Рекомендованная литература
- Daniel Jurafsky & James H. Martin. Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Third Edition. https://web.stanford.edu/~jurafsky/slp3/
- Николаев И.С., Митренина О.В., Ландо Т.М. (ред.) Прикладная и компьютерная лингвистика. Изд 2. URSS. 2017. 320 с.
- Steven Bird, Ewan Klein, Edward Loper. Natural Language Processing with Python. – Analyzing Text with the Natural Language Toolkit. https://www.nltk.org/book/
- Christopher D. Manning & Hinrich Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999.
- Yoav Goldberg. Neural Network Methods for Natural Language Processing (Synthesis Lectures on Human Language Technologies). Edited by Graeme Hirst. Morgan & Claypool 2017
- Cборники конференций COLING, ACL, EACL, LREC, EMNLP, NAACL, "Диалог" последних лет
Содержание учебной дисциплины
1. Предобработка данных
2. Базовые понятия машинного обучения, алгоритмы машинного обучения для задач классификации, кластеризации и регрессии
3. Избранные главы математики для машинного обучения
4. FFN, CNN, RNN, LSTM
5. Sequence-to-sequence, Sequence Tagging, Language Modeling
6. Статические эмбеддинги (Word2Vec, FastText)
7. Контекстуальные эмбеддинги (BERT, ELMo)
Формула оценки
0.5 * Домашние задания + 0.1 * Тесты + 0.2 * Экзамен (Модуль 2) + 0.2 * Экзамен (Модуль 3)