|
|
(не показаны 23 промежуточные версии этого же участника) |
Строка 1: |
Строка 1: |
− | == О курсе ==
| |
| | | |
− | Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.
| |
− |
| |
− | Проводится с 2017 года.
| |
− |
| |
− | '''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ])
| |
− |
| |
− | '''Ассистенты''' Елизавета Корнеева ([mailto:elisavetinaaa@gmail.com Почта]), Егор Соловьев ([mailto:easolovev@edu.hse.ru Почта], [https://t.me/esolovev Telegram ])
| |
− |
| |
− |
| |
− | === Правила выставления оценок ===
| |
− | итоговая оценка = 0.7*накопленная + 0.3*экзамен
| |
− |
| |
− | накопленная оценка — средняя по всем домашним заданиям.
| |
− |
| |
− | # При вычислении накопленной оценки округление не производится
| |
− | # Домашнее задание оценивается по 10-балльной шкале.
| |
− | # В случае пропуска дедлайна за каждый пропущенный день снимается 0.5 балла в течении первых 6 дней. Затем, за каждый пропущенный день снимаются по 1 баллу.
| |
− | # Дедлайны для каждой домашней работы указываются отдельно.
| |
− | # В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
| |
− | # При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
| |
− | # При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
| |
− | # Экзамен проводится в письменной форме.
| |
− |
| |
− | === Рекомендуемая литература ===
| |
− | # Кормен. Алгоритмы: построение и анализ
| |
− | # Bishop. Pattern Recognition and Machine Learning
| |
− | # Christopher Manning. Foundations of Statistical Natural Language Processing
| |
− |
| |
− |
| |
− | === Программные средства ===
| |
− | # редактор кода sublime text / notepad++ / PyCharm
| |
− | # jupyter notebook
| |
− | # numpy, scipy, pandas, matplotlib, seaborn, scikit-learn, gensim, lightgbm, pytorch
| |
− |
| |
− |
| |
− | === Правила сдачи домашних заданий ===
| |
− | Домашние задания сдаются по умолчанию в репозиториях, указанных в [https://goo.gl/wFr8tr форме] '''(пожалуйста, пройдите этот опрос)'''
| |
− |
| |
− | # Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
| |
− | # Не стоит выкладывать в репозиторий запакованные файлы.
| |
− | # Соблюдайте именование каталогов, классов и сигнатур функций, если они явно указаны. В противном случае автотесты их не подцепят и ваше решение не будет засчитано.
| |
− | # Опоздание считается по последнему сданному заданию в домашней работе
| |
− |
| |
− | === Оценки за домашние задания ===
| |
− |
| |
− | === Экзамен ===
| |
− | Экзамен проходит в письменной форме и сотоит из 3 частей
| |
− | # Решение задачи машинного обучения на ноутбуке
| |
− | ## Необходимые библиотеки numpy, scipy, pandas, scikit-learn, nltk. Проверьте что они у вас стоят, и не слишком старой версии.
| |
− | ## Задачи по мотивам домашних работ + обработка текстовых данных.
| |
− | # Вопрос по теории.
| |
− | ## Написать формулы где они есть.
| |
− | # вопрос по применению теории к решению практических задач
| |
− | ## По мотивам теоретических вопросов
| |
− | ## e.g. Каким требованиям должна удовлетворять метрика качества, чтобы ее напрямую можно было оптимизировать с помощью SGD?
| |
− |
| |
− | [http://wiki.cs.hse.ru/index.php?title=Программирование_(python)_для_лингвистов_экзамен вопросы к экзамену]
| |
− |
| |
− | [https://github.com/thedenaas/hse_exam Задачи]
| |
− |
| |
− | Дополнительные материалы для подготовки:
| |
− | # [https://github.com/esokolov/ml-course-hse/ курс] Евгения Соколова по машинному обучению на ФКН
| |
− | # Peter Flatch. Machine Learning
| |
− | # Bishop. Pattern Recognition and Machine Learning
| |
− | # [http://scikit-learn.org/stable/tutorial/index.html Scikit-learn tutorials] and [http://scikit-learn.org/stable/user_guide.html User guide]
| |
− | # [http://cs229.stanford.edu/section/cs229-hmm.pdf Hidden Markov Models Fundamentals]
| |
− |
| |
− | == Семинары ==
| |
− |
| |
− | {| class="wikitable"
| |
− | |-
| |
− | ! № !! Тема семинара !! презентация !! материалы семинара !! домашнее задание !! дедлайн
| |
− | |-
| |
− | | 1 || Объекто-ориентированное программирование || || [https://github.com/thedenaas/hse_seminars/blob/seminar_1/OOP.ipynb notebook] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 1] || 12.09.17 12:00
| |
− | |-
| |
− | | 2 || Паттерны проектирования & web mining, part 1 || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_2 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 2] || 17.10.17 12:00
| |
− | |-
| |
− | | 3 || Тестирование и профилирование программ || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_3 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 3] || 17.10.17 12:00
| |
− | |-
| |
− | | 4 || Алгоритм Рабина-Карпа || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_4 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 4] || 10.10.17 12:00
| |
− | |-
| |
− | | 5 || Scientific libraries: Numpy, scipy, matplotlib || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_5 notebooks] || ||
| |
− | |-
| |
− | | 6 || Scientific libraries: pandas, plotly || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_6 notebooks] || ||
| |
− | |-
| |
− | | 7 || Linear Regression || || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_7 notes and Assignment 5] || 18.10.17 12:00
| |
− | |-
| |
− | | 8 || Regularization in linear models || || || ||
| |
− | |-
| |
− | | 9 || Classification with linear models|| || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_9 data] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_9 Assignment 6] || 11.11.17 12:00
| |
− | |-
| |
− | | 10 || SVM || || || ||
| |
− | |-
| |
− | | 11 || Word embeddings || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/dist_representation.ipynb notebook] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/data.zip datasets]|| [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/hw_ner.ipynb Assignment 7] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/hw_sentiment_analysis.ipynb Assignment 8] || 3.12.17 12:00
| |
− | |-
| |
− | | 12 || Decision trees. Random Forest || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_12/trees.ipynb notebook] || ||
| |
− | |-
| |
− | | 13 || Boosting || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_13/ notebook] || ||
| |
− | |-
| |
− | | 14 || Dimension reduction. PCA, SVD || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_14/ notebook] || ||
| |
− | |-
| |
− | | 15 || Clustering. Kmeans, DBSCAN, Agglomerative clustering || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/ notebook] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/data.zip data] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/hw_titanic.ipynb Assignment 9]|| 22.12.2017 12.00
| |
− | |-
| |
− | | 16 || Topic modeing || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_16/ notebook] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 10] || 24.01.2018 12.00
| |
− | |-
| |
− | | 17 || Hidden Markov Models || || || ||
| |
− | |-
| |
− | | 18 || Hidden Markov Models(continued). Feedforward Neural Networks || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_18/ notebooks] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_18/hw_11.ipynb Assignment 11] || 25.02.2018 12.00
| |
− | |-
| |
− | | 19 || Training Neural Networks. Convolutional and recurrent NN for text classification and language modeling || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_19/ notebooks] || ||
| |
− | |-
| |
− | | 20 || Basic seq2seq models applied to machine translation || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_20/ notebooks] || ||
| |
− | |-
| |
− |
| |
− | |}
| |