Компьютерная лингвистика и информационные технологии — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Семинары)
(Семинары)
 
(не показаны 2 промежуточные версии этого же участника)
Строка 7: Строка 7:
 
'''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ])
 
'''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ])
  
'''Ассистенты''' Азат Калмыков ([mailto:aakalmykov@edu.hse.ru Почта], [https://t.me/Azatik1000 Telegram ]), Антон Ханаев ([mailto:askhanaev@edu.hse.ru Почта], [https://t.me/neeveermoree Telegram ])
+
'''Ассистенты''' Антон Ханаев ([mailto:askhanaev@edu.hse.ru Почта], [https://t.me/neeveermoree Telegram ])
  
  
Строка 78: Строка 78:
 
| 7 || Feed Forward Neural Networks || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_7 seminar]  ||  ||  
 
| 7 || Feed Forward Neural Networks || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_7 seminar]  ||  ||  
 
|-
 
|-
| 8 || Distributed representations. CNN ||  || [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_8/assignment_5.ipynb assignment]  ||  29.12.2019 23:59
+
| 8 || Distributed representations. CNN || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_8 seminar] || [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_8/assignment_5.ipynb assignment]  ||  29.12.2019 23:59
 
|-
 
|-
| 9 || RNN ||  ||  ||  
+
| 9 || RNN || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_9 seminar] ||  [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_9 assignment] || 02.02.2020 23:59
 
|-
 
|-
 
| 10 || Seq2seq||  ||  ||  
 
| 10 || Seq2seq||  ||  ||  

Текущая версия на 15:32, 16 января 2020

О курсе

Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.

Проводится с 2017 года.

Преподаватель: Денис Литвинов (Почта, Telegram )

Ассистенты Антон Ханаев (Почта, Telegram )


Правила выставления оценок

итоговая оценка = 0.7*накопленная + 0.3*экзамен

накопленная оценка — средняя по всем домашним заданиям.

  1. При вычислении накопленной оценки округление не производится
  2. Домашнее задание оценивается по 10-балльной шкале.
  3. В случае пропуска дедлайна за каждый пропущенный день снимается 0.5 балла в течении первых 6 дней. Затем, за каждый пропущенный день снимаются по 1 баллу.
  4. Дедлайны для каждой домашней работы указываются отдельно.
  5. В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
  6. При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
  7. При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
  8. Экзамен проводится в письменной форме.

Рекомендуемая литература

  1. James G. An introduction to statistical learning
  2. Bishop. Pattern Recognition and Machine Learning
  3. Christopher Manning. Foundations of Statistical Natural Language Processing
  4. Goodfellow and Bengio. Deep Learning
  5. Dive Into Deep Learning
  6. курс Евгения Соколова по машинному обучению на ФКН


Программные средства

  1. jupyter notebook
  2. numpy, scipy, pandas, matplotlib, seaborn, scikit-learn, gensim, lightgbm, pytorch

Правила сдачи домашних заданий

Домашние задания сдаются по умолчанию в репозиториях, указанных в форме (пожалуйста, пройдите этот опрос)

  1. Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
  2. Не стоит выкладывать в репозиторий запакованные файлы.
  3. Опоздание считается по последнему сданному заданию в домашней работе

Оценки за домашние задания

оценки

Экзамен

Экзамен проходит в письменной форме и сотоит из 3 частей

  1. Решение задачи машинного обучения на ноутбуке
    1. Необходимые библиотеки numpy, scipy, pandas, scikit-learn, nltk. Проверьте что они у вас стоят, и не слишком старой версии.
    2. Задачи по мотивам домашних работ + обработка текстовых данных.
  2. Вопрос по теории.
    1. Написать формулы где они есть.
  3. вопрос по применению теории к решению практических задач
    1. По мотивам теоретических вопросов
    2. e.g. Каким требованиям должна удовлетворять метрика качества, чтобы ее напрямую можно было оптимизировать с помощью SGD?

Семинары

Тема семинара материалы семинара домашнее задание дедлайн
1 Алгоритмы для обработки текста seminar assignment 7.10.2019 10:00 am
2 Избранные главы математики для машинного обучения seminar
3 Базовые понятия машинного обучения seminar assignment 21.10.2019 10:00 am
4 Регуляризация в линейных моделях seminar
5 Линейный модели классификации seminar assignment 18.11.2019 23:59
6 Решающие деревья и ансамбли. seminar assignment 2.12.2019 23:59
7 Feed Forward Neural Networks seminar
8 Distributed representations. CNN seminar assignment 29.12.2019 23:59
9 RNN seminar assignment 02.02.2020 23:59
10 Seq2seq
11 Transfer learning
12 Information retrieval
13 Topic Modeling