|
|
(не показано 15 промежуточных версии этого же участника) |
Строка 1: |
Строка 1: |
− | == О курсе ==
| |
| | | |
− | Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.
| |
− |
| |
− | Проводится с 2017 года.
| |
− |
| |
− | '''Преподаватель:''' Денис Литвинов ([mailto:4denaas@gmail.com Почта], [https://t.me/denaas Telegram ])
| |
− |
| |
− | '''Ассистенты''' Елизавета Корнеева ([mailto:elisavetinaaa@gmail.com Почта], [https://t.me/tithemi Telegram ]), Егор Соловьев ([mailto:easolovev@edu.hse.ru Почта], [https://t.me/esolovev Telegram ])
| |
− |
| |
− |
| |
− | === Правила выставления оценок ===
| |
− | итоговая оценка = 0.7*накопленная + 0.3*экзамен
| |
− |
| |
− | накопленная оценка — средняя по всем домашним заданиям.
| |
− |
| |
− | # При вычислении накопленной оценки округление не производится
| |
− | # Домашнее задание оценивается по 10-балльной шкале.
| |
− | # В случае пропуска дедлайна за каждый пропущенный день снимается 0.5 балла в течении первых 6 дней. Затем, за каждый пропущенный день снимаются по 1 баллу.
| |
− | # Дедлайны для каждой домашней работы указываются отдельно.
| |
− | # В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
| |
− | # При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
| |
− | # При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
| |
− | # Экзамен проводится в письменной форме.
| |
− |
| |
− | === Рекомендуемая литература ===
| |
− | # Кормен. Алгоритмы: построение и анализ
| |
− | # Bishop. Pattern Recognition and Machine Learning
| |
− | # Christopher Manning. Foundations of Statistical Natural Language Processing
| |
− |
| |
− |
| |
− | === Программные средства ===
| |
− | # редактор кода sublime text / notepad++ / PyCharm
| |
− | # jupyter notebook
| |
− | # numpy, scipy, pandas, matplotlib, seaborn, scikit-learn, gensim, lightgbm, pytorch
| |
− |
| |
− |
| |
− | === Правила сдачи домашних заданий ===
| |
− | Домашние задания сдаются по умолчанию в репозиториях, указанных в [https://goo.gl/wFr8tr форме] '''(пожалуйста, пройдите этот опрос)'''
| |
− |
| |
− | # Домашнее задание выполняется в jupyter notebook, если явно не указано иное.
| |
− | # Не стоит выкладывать в репозиторий запакованные файлы.
| |
− | # Соблюдайте именование каталогов, классов и сигнатур функций, если они явно указаны. В противном случае автотесты их не подцепят и ваше решение не будет засчитано.
| |
− | # Опоздание считается по последнему сданному заданию в домашней работе
| |
− |
| |
− | === Оценки за домашние задания ===
| |
− |
| |
− | === Экзамен ===
| |
− | Экзамен проходит в письменной форме и сотоит из 3 частей
| |
− | # Решение задачи машинного обучения на ноутбуке
| |
− | ## Необходимые библиотеки numpy, scipy, pandas, scikit-learn, nltk. Проверьте что они у вас стоят, и не слишком старой версии.
| |
− | ## Задачи по мотивам домашних работ + обработка текстовых данных.
| |
− | # Вопрос по теории.
| |
− | ## Написать формулы где они есть.
| |
− | # вопрос по применению теории к решению практических задач
| |
− | ## По мотивам теоретических вопросов
| |
− | ## e.g. Каким требованиям должна удовлетворять метрика качества, чтобы ее напрямую можно было оптимизировать с помощью SGD?
| |
− |
| |
− | [http://wiki.cs.hse.ru/index.php?title=Программирование_(python)_для_лингвистов_экзамен вопросы к экзамену]
| |
− |
| |
− | Дополнительные материалы для подготовки:
| |
− | # [https://github.com/esokolov/ml-course-hse/ курс] Евгения Соколова по машинному обучению на ФКН
| |
− | # Peter Flatch. Machine Learning
| |
− | # Bishop. Pattern Recognition and Machine Learning
| |
− | # [http://scikit-learn.org/stable/tutorial/index.html Scikit-learn tutorials] and [http://scikit-learn.org/stable/user_guide.html User guide]
| |
− | # [http://cs229.stanford.edu/section/cs229-hmm.pdf Hidden Markov Models Fundamentals]
| |
− |
| |
− | == Семинары ==
| |
− |
| |
− | {| class="wikitable"
| |
− | |-
| |
− | ! № !! Тема семинара !! материалы семинара !! домашнее задание !! дедлайн
| |
− | |-
| |
− | | 1 || Теория алгоритмов. Фильтр Блума. Алгоритм Рабина-Карпа || [https://github.com/thedenaas/hse_seminars_2018/tree/master/seminar_1 seminar_1] || [https://github.com/thedenaas/hse_seminars_2018/tree/master/seminar_1 assignment_1] || 18.09.2018 12:00
| |
− | |-
| |
− | | 2 || Тестирование программ. Визуализация. Избранные главы теории вероятностей и линейной алгебры. || [https://github.com/thedenaas/hse_seminars_2018/tree/master/seminar_2 seminar_2] || ||
| |
− | |-
| |
− | | 3 || Основные понятия машинного обучения || [https://github.com/thedenaas/hse_seminars_2018/tree/master/seminar_3 seminar_3] || ||
| |
− | |-
| |
− | |}
| |