Прикладные задачи анализа данных (майнор - весна 2018)
Содержание
О курсе
Читается для студентов 3 курса в 3-4 модулях.
Лекции проходят по четвергам, 10:30 – 11:50, ауд. 5306 (Шаболовка, 26).
Лекторы:
В 3 модуле: Екатерина Черняк (автоматическая обработка текстов)
В 4 модуле: Дмитрий Игнатов (майнинг данных)
Сдача домашних заданий: в системе Anytask
Канал для оповещений в Telegram
Семинары
Семинары проходят по четвергам (Шаболовка, 26).
Группа | Преподаватель | Расписание | чат группы |
---|---|---|---|
ИАД1 | Наталья Козловская | 12:10 – 13:30, ауд. 3316 | |
ИАД2 | Иван Смуров | 12:10 – 13:30, ауд. 4428 | |
ИАД3 | Александр Панов | 09:00 – 10:20, ауд. 4435 | |
ИАД4 | Анна Шишкова | 12:10 – 13:00, ауд. 4335 | ссылка |
Система оценок
Результирующая оценка рассчитывается по формуле:
Oитоговая = 0.6 * Oнакопл + 0.4 * Оэкз
Накопленная оценка рассчитывается по формуле:
Oнакопл = 0.7 * Oдз (4 шт) + 0.3 * Oср (2 шт)
Активная работа на семинарах может положительно повлиять на округление оценки в спорных ситуациях.
При накопленное оценке в 8, 9, 10 баллов такая же оценка за экзамен выставляется автоматом.
[Здесь будет ссылка на ведомость, (ведомость)]
Программа
18.01.2018
Лекция (Е. Черняк): Введение в автоматическую обработку текстов (слайды)
Семинар: Regexp
25.01.2018
Лекция: Семинар: NLTK
Рекомендуемые ресурсы
На английском
- Jurafsky & Martin (link)
- Курс Лауры Каллмайер по МО для АОТ (link)
- Курс Нильса Раймерса по DL для АОТ (link)
- Курс в Оксфорде по DL для АОТ (link)
- Курс в Стенфорде по DL для AOT (link)
- Материалы по обучению с подкреплением (Reinforcment Learning) (link)
На русском (и про русский, в основном)
- НКРЯ (link)
- Открытый корпус (link)
- Дистрибутивные семантические модели для русского языка (link)
- Морфология (link)
- Синтаксис (link)
- Томита-парсер (link)
- Все на свете: (mathlingvo), (nlpub)
- Text Visualisation browser: (link)
Ссылка на дополнительную литературу:
Литература
- Manning, Christopher D., and Hinrich Schütze. Foundations of statistical natural language processing. Vol. 999. Cambridge: MIT press, 1999.
- Martin, James H., and Daniel Jurafsky. "Speech and language processing." International Edition 710 (2000): 25.
- Cohen, Shay. "Bayesian analysis in natural language processing." Synthesis Lectures on Human Language Technologies 9, no. 2 (2016): 1-274.
- Goldberg, Yoav. "Neural Network Methods for Natural Language Processing." Synthesis Lectures on Human Language Technologies 10, no. 1 (2017): 1-309.