Компьютерная лингвистика и информационные технологии
Материал из Wiki - Факультет компьютерных наук
Версия от 11:35, 15 марта 2020; Denaas (обсуждение | вклад)
Содержание
[убрать]О курсе
Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.
Проводится с 2017 года.
Преподаватель: Денис Литвинов (Почта, Telegram )
Ассистенты Антон Ханаев (Почта, Telegram )
Правила выставления оценок
итоговая оценка = 0.7*накопленная + 0.3*экзамен
накопленная оценка — средняя по всем домашним заданиям.
- При вычислении накопленной оценки округление не производится
- Домашнее задание оценивается по 10-балльной шкале.
- В случае пропуска дедлайна за каждый пропущенный день снимается 0.5 балла в течении первых 6 дней. Затем, за каждый пропущенный день снимаются по 1 баллу.
- Дедлайны для каждой домашней работы указываются отдельно.
- В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
- При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
- При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
- Экзамен проводится в письменной форме.
Рекомендуемая литература
- James G. An introduction to statistical learning
- Bishop. Pattern Recognition and Machine Learning
- Christopher Manning. Foundations of Statistical Natural Language Processing
- Goodfellow and Bengio. Deep Learning
- Dive Into Deep Learning
- курс Евгения Соколова по машинному обучению на ФКН
Программные средства
- jupyter notebook
- numpy, scipy, pandas, matplotlib, seaborn, scikit-learn, gensim, lightgbm, pytorch
Правила сдачи домашних заданий
Домашние задания сдаются по умолчанию в репозиториях, указанных в форме (пожалуйста, пройдите этот опрос)
- Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
- Не стоит выкладывать в репозиторий запакованные файлы.
- Опоздание считается по последнему сданному заданию в домашней работе
Оценки за домашние задания
Экзамен
Экзамен проходит в письменной форме и сотоит из 3 частей
- Решение задачи машинного обучения на ноутбуке
- Необходимые библиотеки numpy, scipy, pandas, scikit-learn, nltk. Проверьте что они у вас стоят, и не слишком старой версии.
- Задачи по мотивам домашних работ + обработка текстовых данных.
- Вопрос по теории.
- Написать формулы где они есть.
- вопрос по применению теории к решению практических задач
- По мотивам теоретических вопросов
- e.g. Каким требованиям должна удовлетворять метрика качества, чтобы ее напрямую можно было оптимизировать с помощью SGD?
Семинары
№ | Тема семинара | материалы семинара | домашнее задание | дедлайн |
---|---|---|---|---|
1 | Алгоритмы для обработки текста | seminar | assignment | 7.10.2019 10:00 am |
2 | Избранные главы математики для машинного обучения | seminar | ||
3 | Базовые понятия машинного обучения | seminar | assignment | 21.10.2019 10:00 am |
4 | Регуляризация в линейных моделях | seminar | ||
5 | Линейный модели классификации | seminar | assignment | 18.11.2019 23:59 |
6 | Решающие деревья и ансамбли. | seminar | assignment | 2.12.2019 23:59 |
7 | Feed Forward Neural Networks | seminar | ||
8 | Distributed representations. CNN | seminar | assignment | 29.12.2019 23:59 |
9 | RNN | seminar | assignment | 02.02.2020 23:59 |
10 | Seq2seq | seminar | assignment | 23.02.2020 23:59 |
11 | Transfer learning | seminar | ||
12 | Information retrieval | seminar | assignment | 13.03.2020 23:59 |
13 | Topic Modeling | seminar | assignment | 22.03.2020 23:59 |