Компьютерная лингвистика и информационные технологии — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Семинары)
(Семинары)
 
(не показано 17 промежуточных версии этого же участника)
Строка 7: Строка 7:
 
'''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ])
 
'''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ])
  
'''Ассистенты''' Азат Калмыков ([mailto:aakalmykov@edu.hse.ru Почта], [https://t.me/Azatik1000 Telegram ]), Антон Ханаев ([mailto:askhanaev@edu.hse.ru Почта], [https://t.me/neeveermoree Telegram ])
+
'''Ассистенты''' Антон Ханаев ([mailto:askhanaev@edu.hse.ru Почта], [https://t.me/neeveermoree Telegram ])
  
  
Строка 42: Строка 42:
 
# Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
 
# Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
 
# Не стоит выкладывать в репозиторий запакованные файлы.   
 
# Не стоит выкладывать в репозиторий запакованные файлы.   
# Соблюдайте именование каталогов, классов и сигнатур функций, если они явно указаны. В противном случае автотесты их не подцепят и ваше решение не будет засчитано.
 
 
# Опоздание считается по последнему сданному заданию в домашней работе
 
# Опоздание считается по последнему сданному заданию в домашней работе
  
 
=== Оценки за домашние задания ===
 
=== Оценки за домашние задания ===
 +
[https://docs.google.com/spreadsheets/d/1PRTNt9VjTIydmXKHq-qd2v9nPG7EPooH-FIR1Zh4sTU/edit?usp=sharing оценки]
  
 
=== Экзамен ===
 
=== Экзамен ===
Строка 68: Строка 68:
 
| 2 || Избранные главы математики для машинного обучения || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_2 seminar]  ||  ||  
 
| 2 || Избранные главы математики для машинного обучения || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_2 seminar]  ||  ||  
 
|-
 
|-
| 3 || Базовые понятия машинного обучения || ||  ||  
+
| 3 || Базовые понятия машинного обучения || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_3 seminar]  || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_3 assignment]   || 21.10.2019 10:00 am
 
|-
 
|-
| 4 || Регуляризация в линейных моделях || ||  ||  
+
| 4 || Регуляризация в линейных моделях || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_4 seminar] ||  ||  
 
|-
 
|-
| 5 || Линейный модели классификации||  ||  ||  
+
| 5 || Линейный модели классификации||  [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_5 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_5 assignment]   || 18.11.2019 23:59
 
|-
 
|-
| 6 || Решающие деревья и ансамбли. || ||  ||  
+
| 6 || Решающие деревья и ансамбли. ||   [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_6 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_6 assignment]   || 2.12.2019 23:59
 
|-
 
|-
| 7 || Feed Forward Neural Networks ||  ||  ||  
+
| 7 || Feed Forward Neural Networks || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_7 seminar] ||  ||  
 
|-
 
|-
| 8 || Distributed representations. CNN ||  ||   ||  
+
| 8 || Distributed representations. CNN || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_8 seminar] || [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_8/assignment_5.ipynb assignment]  || 29.12.2019 23:59
 
|-
 
|-
| 9 || RNN ||  ||  ||  
+
| 9 || RNN || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_9 seminar] ||  [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_9 assignment] || 02.02.2020 23:59
 
|-
 
|-
| 10 || Seq2seq||  ||  ||  
+
| 10 || Seq2seq|| [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_10 seminar] ||  [https://github.com/thedenaas/hse_seminars/blob/master/2019/seminar_10 assignment] || 23.02.2020 23:59
 +
|-
 
|-
 
|-
| 11 || Transfer learning ||  ||  ||  
+
| 11 || Transfer learning || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_11 seminar] ||  ||  
 
|-
 
|-
| 12 || Information retrieval || ||   ||  
+
| 12 || Information retrieval || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_12 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_12 assignment]  || 13.03.2020 23:59
 
|-
 
|-
| 13 || Topic Modeling || ||   ||  
+
| 13 || Topic Modeling || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_13 seminar] || [https://github.com/thedenaas/hse_seminars/tree/master/2019/seminar_13 assignment]  || 22.03.2020 23:59
 
|-
 
|-
  
 
|}
 
|}

Текущая версия на 11:35, 15 марта 2020

О курсе

Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.

Проводится с 2017 года.

Преподаватель: Денис Литвинов (Почта, Telegram )

Ассистенты Антон Ханаев (Почта, Telegram )


Правила выставления оценок

итоговая оценка = 0.7*накопленная + 0.3*экзамен

накопленная оценка — средняя по всем домашним заданиям.

  1. При вычислении накопленной оценки округление не производится
  2. Домашнее задание оценивается по 10-балльной шкале.
  3. В случае пропуска дедлайна за каждый пропущенный день снимается 0.5 балла в течении первых 6 дней. Затем, за каждый пропущенный день снимаются по 1 баллу.
  4. Дедлайны для каждой домашней работы указываются отдельно.
  5. В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
  6. При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
  7. При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
  8. Экзамен проводится в письменной форме.

Рекомендуемая литература

  1. James G. An introduction to statistical learning
  2. Bishop. Pattern Recognition and Machine Learning
  3. Christopher Manning. Foundations of Statistical Natural Language Processing
  4. Goodfellow and Bengio. Deep Learning
  5. Dive Into Deep Learning
  6. курс Евгения Соколова по машинному обучению на ФКН


Программные средства

  1. jupyter notebook
  2. numpy, scipy, pandas, matplotlib, seaborn, scikit-learn, gensim, lightgbm, pytorch

Правила сдачи домашних заданий

Домашние задания сдаются по умолчанию в репозиториях, указанных в форме (пожалуйста, пройдите этот опрос)

  1. Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
  2. Не стоит выкладывать в репозиторий запакованные файлы.
  3. Опоздание считается по последнему сданному заданию в домашней работе

Оценки за домашние задания

оценки

Экзамен

Экзамен проходит в письменной форме и сотоит из 3 частей

  1. Решение задачи машинного обучения на ноутбуке
    1. Необходимые библиотеки numpy, scipy, pandas, scikit-learn, nltk. Проверьте что они у вас стоят, и не слишком старой версии.
    2. Задачи по мотивам домашних работ + обработка текстовых данных.
  2. Вопрос по теории.
    1. Написать формулы где они есть.
  3. вопрос по применению теории к решению практических задач
    1. По мотивам теоретических вопросов
    2. e.g. Каким требованиям должна удовлетворять метрика качества, чтобы ее напрямую можно было оптимизировать с помощью SGD?

Семинары

Тема семинара материалы семинара домашнее задание дедлайн
1 Алгоритмы для обработки текста seminar assignment 7.10.2019 10:00 am
2 Избранные главы математики для машинного обучения seminar
3 Базовые понятия машинного обучения seminar assignment 21.10.2019 10:00 am
4 Регуляризация в линейных моделях seminar
5 Линейный модели классификации seminar assignment 18.11.2019 23:59
6 Решающие деревья и ансамбли. seminar assignment 2.12.2019 23:59
7 Feed Forward Neural Networks seminar
8 Distributed representations. CNN seminar assignment 29.12.2019 23:59
9 RNN seminar assignment 02.02.2020 23:59
10 Seq2seq seminar assignment 23.02.2020 23:59
11 Transfer learning seminar
12 Information retrieval seminar assignment 13.03.2020 23:59
13 Topic Modeling seminar assignment 22.03.2020 23:59