Программирование (python) для лингвистов — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Denaas (обсуждение | вклад) (→Экзамен) |
Denaas (обсуждение | вклад) (→Экзамен) |
||
Строка 53: | Строка 53: | ||
# решение задачи машинного обучения на ноутбуке. | # решение задачи машинного обучения на ноутбуке. | ||
# теоритеческий вопрос | # теоритеческий вопрос | ||
− | # вопрос по | + | # вопрос по применению теории к решению практичесих задач |
[http://wiki.cs.hse.ru/index.php?title=Программирование_(python)_для_лингвистов_экзамен вопросы к экзамену] | [http://wiki.cs.hse.ru/index.php?title=Программирование_(python)_для_лингвистов_экзамен вопросы к экзамену] |
Версия 18:30, 2 марта 2018
Содержание
О курсе
Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.
Проводится с 2017 года.
Преподаватель: Денис Литвинов (Почта, Telegram )
Ассистент Елизавета Корнеева (Почта)
Практические занятия проходят по средам 9:00-10:20 + 2 занятия в четверг (смотрите расписание)
Правила выставления оценок
итоговая оценка = 0.7*накопленная + 0.3*экзамен
накопленная оценка — средняя по всем дз
- Домашнее задание оценивается по 10-балльной шкале.
- В случае пропуска дедлайна за каждый пропущенный день снимается 1 балл, пока балл >= 3. Затем, за каждый пропущенный день снимаются по 0.5 балла.
- Дедлайны для каждой домашней работы указываются отдельно.
- В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
- При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
- При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
- Экзамен проводится в письменной форме.
Рекомендуемая литература
- Кормен. Алгоритмы: построение и анализ
- Bishop. Pattern Recognition and Machine Learning
- Jurafsky. Speech and Language Processing
- Barber. Bayesian Reasoning and Machine Learning
Программные средства
- редактор кода sublime text / notepad++ / PyCharm
- jupyter notebook
- numpy, scipy, pandas, matplotlib, seaborn, plotly, scikit-learn, gensim, xgboost
Правила сдачи домашних заданий
Домашние задания сдаются по умолчанию в репозиториях, указанных в форме (пожалуйста, пройдите этот опрос)
!!!
- Соблюдайте именование каталогов, классов и сигнатур функций! В противном случае автотесты их не подцепят и ваше решение не будет засчитано.
- Если явно не сказано, то в скрипте должен присутствовать только код класса/функции, без демонстрации их вызовов с какими либо аргументами.
- Если явно не сказано, в репозиторий вы грузите скрипты с раширением *.py или ноутбуки *.ipynb. (Но никак не архивы)
- Опоздание считается по последнему сданному заданию в домашней работе
Оценки за домашние задания
Экзамен
Экзамен проходит в письменной форме и сотоит из 3 частей
- решение задачи машинного обучения на ноутбуке.
- теоритеческий вопрос
- вопрос по применению теории к решению практичесих задач
Семинары
№ | Тема семинара | презентация | материалы семинара | домашнее задание | дедлайн |
---|---|---|---|---|---|
1 | Объекто-ориентированное программирование | notebook | Assignment 1 | 12.09.17 12:00 | |
2 | Паттерны проектирования & web mining, part 1 | notebooks | Assignment 2 | 17.10.17 12:00 | |
3 | Тестирование и профилирование программ | notebooks | Assignment 3 | 17.10.17 12:00 | |
4 | Алгоритм Рабина-Карпа | notebooks | Assignment 4 | 10.10.17 12:00 | |
5 | Scientific libraries: Numpy, scipy, matplotlib | notebooks | |||
6 | Scientific libraries: pandas, plotly | notebooks | |||
7 | Linear Regression | notes and Assignment 5 | 18.10.17 12:00 | ||
8 | Regularization in linear models | ||||
9 | Classification with linear models | data | Assignment 6 | 11.11.17 12:00 | |
10 | SVM | ||||
11 | Word embeddings | notebook datasets | Assignment 7 Assignment 8 | 3.12.17 12:00 | |
12 | Decision trees. Random Forest | notebook | |||
13 | Boosting | notebook | |||
14 | Dimension reduction. PCA, SVD | notebook | |||
15 | Clustering. Kmeans, DBSCAN, Agglomerative clustering | notebook | data Assignment 9 | 22.12.2017 12.00 | |
16 | Topic modeing | notebook | Assignment 10 | 24.01.2018 12.00 | |
17 | Hidden Markov Models | ||||
18 | Hidden Markov Models(continued). Feedforward Neural Networks | notebooks | Assignment 11 | 25.02.2018 12.00 |