Компьютерная лингвистика и информационные технологии — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Denaas (обсуждение | вклад) (→Семинары) |
Denaas (обсуждение | вклад) (→Семинары) |
||
(не показано 12 промежуточных версии этого же участника) | |||
Строка 7: | Строка 7: | ||
'''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ]) | '''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ]) | ||
− | '''Ассистенты''' | + | '''Ассистенты''' Антон Ханаев ([mailto:askhanaev@edu.hse.ru Почта], [https://t.me/neeveermoree Telegram ]) |
Строка 45: | Строка 45: | ||
=== Оценки за домашние задания === | === Оценки за домашние задания === | ||
+ | [https://docs.google.com/spreadsheets/d/1PRTNt9VjTIydmXKHq-qd2v9nPG7EPooH-FIR1Zh4sTU/edit?usp=sharing оценки] | ||
=== Экзамен === | === Экзамен === | ||
Строка 71: | Строка 72: | ||
| 4 || Регуляризация в линейных моделях || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_4 seminar] || || | | 4 || Регуляризация в линейных моделях || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_4 seminar] || || | ||
|- | |- | ||
− | | 5 || Линейный модели классификации|| || || | + | | 5 || Линейный модели классификации|| [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_5 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_5 assignment] || 18.11.2019 23:59 |
|- | |- | ||
− | | 6 || Решающие деревья и ансамбли. || | + | | 6 || Решающие деревья и ансамбли. || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_6 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_6 assignment] || 2.12.2019 23:59 |
|- | |- | ||
− | | 7 || Feed Forward Neural Networks || || || | + | | 7 || Feed Forward Neural Networks || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_7 seminar] || || |
|- | |- | ||
− | | 8 || Distributed representations. CNN || || | + | | 8 || Distributed representations. CNN || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_8 seminar] || [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_8/assignment_5.ipynb assignment] || 29.12.2019 23:59 |
|- | |- | ||
− | | 9 || RNN || || || | + | | 9 || RNN || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_9 seminar] || [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_9 assignment] || 02.02.2020 23:59 |
|- | |- | ||
− | | 10 || Seq2seq|| || || | + | | 10 || Seq2seq|| [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_10 seminar] || [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_10 assignment] || 23.02.2020 23:59 |
+ | |- | ||
|- | |- | ||
− | | 11 || Transfer learning || || || | + | | 11 || Transfer learning || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_11 seminar] || || |
|- | |- | ||
− | | 12 || Information retrieval || | + | | 12 || Information retrieval || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_12 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_12 assignment] || 13.03.2020 23:59 |
|- | |- | ||
− | | 13 || Topic Modeling || | + | | 13 || Topic Modeling || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_13 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_13 assignment] || 22.03.2020 23:59 |
|- | |- | ||
|} | |} |
Текущая версия на 11:35, 15 марта 2020
Содержание
О курсе
Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.
Проводится с 2017 года.
Преподаватель: Денис Литвинов (Почта, Telegram )
Ассистенты Антон Ханаев (Почта, Telegram )
Правила выставления оценок
итоговая оценка = 0.7*накопленная + 0.3*экзамен
накопленная оценка — средняя по всем домашним заданиям.
- При вычислении накопленной оценки округление не производится
- Домашнее задание оценивается по 10-балльной шкале.
- В случае пропуска дедлайна за каждый пропущенный день снимается 0.5 балла в течении первых 6 дней. Затем, за каждый пропущенный день снимаются по 1 баллу.
- Дедлайны для каждой домашней работы указываются отдельно.
- В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
- При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
- При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
- Экзамен проводится в письменной форме.
Рекомендуемая литература
- James G. An introduction to statistical learning
- Bishop. Pattern Recognition and Machine Learning
- Christopher Manning. Foundations of Statistical Natural Language Processing
- Goodfellow and Bengio. Deep Learning
- Dive Into Deep Learning
- курс Евгения Соколова по машинному обучению на ФКН
Программные средства
- jupyter notebook
- numpy, scipy, pandas, matplotlib, seaborn, scikit-learn, gensim, lightgbm, pytorch
Правила сдачи домашних заданий
Домашние задания сдаются по умолчанию в репозиториях, указанных в форме (пожалуйста, пройдите этот опрос)
- Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
- Не стоит выкладывать в репозиторий запакованные файлы.
- Опоздание считается по последнему сданному заданию в домашней работе
Оценки за домашние задания
Экзамен
Экзамен проходит в письменной форме и сотоит из 3 частей
- Решение задачи машинного обучения на ноутбуке
- Необходимые библиотеки numpy, scipy, pandas, scikit-learn, nltk. Проверьте что они у вас стоят, и не слишком старой версии.
- Задачи по мотивам домашних работ + обработка текстовых данных.
- Вопрос по теории.
- Написать формулы где они есть.
- вопрос по применению теории к решению практических задач
- По мотивам теоретических вопросов
- e.g. Каким требованиям должна удовлетворять метрика качества, чтобы ее напрямую можно было оптимизировать с помощью SGD?
Семинары
№ | Тема семинара | материалы семинара | домашнее задание | дедлайн |
---|---|---|---|---|
1 | Алгоритмы для обработки текста | seminar | assignment | 7.10.2019 10:00 am |
2 | Избранные главы математики для машинного обучения | seminar | ||
3 | Базовые понятия машинного обучения | seminar | assignment | 21.10.2019 10:00 am |
4 | Регуляризация в линейных моделях | seminar | ||
5 | Линейный модели классификации | seminar | assignment | 18.11.2019 23:59 |
6 | Решающие деревья и ансамбли. | seminar | assignment | 2.12.2019 23:59 |
7 | Feed Forward Neural Networks | seminar | ||
8 | Distributed representations. CNN | seminar | assignment | 29.12.2019 23:59 |
9 | RNN | seminar | assignment | 02.02.2020 23:59 |
10 | Seq2seq | seminar | assignment | 23.02.2020 23:59 |
11 | Transfer learning | seminar | ||
12 | Information retrieval | seminar | assignment | 13.03.2020 23:59 |
13 | Topic Modeling | seminar | assignment | 22.03.2020 23:59 |