Программирование (python) для лингвистов — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Denaas (обсуждение | вклад) (→Семинары) |
Denaas (обсуждение | вклад) (→Семинары) |
||
Строка 55: | Строка 55: | ||
! № !! Тема семинара !! презентация !! материалы семинара !! домашнее задание !! дедлайн | ! № !! Тема семинара !! презентация !! материалы семинара !! домашнее задание !! дедлайн | ||
|- | |- | ||
− | | 1 || Объекто-ориентированное программирование || || [https://github.com/thedenaas/hse_seminars/blob/seminar_1/OOP.ipynb notebook] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 | + | | 1 || Объекто-ориентированное программирование || || [https://github.com/thedenaas/hse_seminars/blob/seminar_1/OOP.ipynb notebook] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 1] || 12.09.17 12:00 |
|- | |- | ||
− | | 2 || Паттерны проектирования & web mining, part 1 || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_2 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 | + | | 2 || Паттерны проектирования & web mining, part 1 || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_2 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 2] || 17.10.17 12:00 |
|- | |- | ||
− | | 3 || Тестирование и профилирование программ || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_3 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 | + | | 3 || Тестирование и профилирование программ || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_3 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 3] || 17.10.17 12:00 |
|- | |- | ||
− | | 4 || Алгоритм Рабина-Карпа || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_4 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 | + | | 4 || Алгоритм Рабина-Карпа || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_4 notebooks] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 4] || 10.10.17 12:00 |
|- | |- | ||
| 5 || Scientific libraries: Numpy, scipy, matplotlib || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_5 notebooks] || || | | 5 || Scientific libraries: Numpy, scipy, matplotlib || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_5 notebooks] || || | ||
Строка 67: | Строка 67: | ||
| 6 || Scientific libraries: pandas, plotly || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_6 notebooks] || || | | 6 || Scientific libraries: pandas, plotly || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_6 notebooks] || || | ||
|- | |- | ||
− | | 7 || Linear Regression || || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_7 notes and | + | | 7 || Linear Regression || || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_7 notes and Assignment 5] || 18.10.17 12:00 |
|- | |- | ||
| 8 || Regularization in linear models || || || || | | 8 || Regularization in linear models || || || || | ||
|- | |- | ||
− | | 9 || Classification with linear models|| || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_9 data] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_9 | + | | 9 || Classification with linear models|| || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_9 data] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_9 Assignment 6] || 11.11.17 12:00 |
|- | |- | ||
| 10 || SVM || || || || | | 10 || SVM || || || || | ||
|- | |- | ||
− | | 11 || Word embeddings || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/dist_representation.ipynb notebook] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/data.zip datasets]|| [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/hw_ner.ipynb | + | | 11 || Word embeddings || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/dist_representation.ipynb notebook] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/data.zip datasets]|| [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/hw_ner.ipynb Assignment 7] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_11/hw_sentiment_analysis.ipynb Assignment 8] || 3.12.17 12:00 |
|- | |- | ||
| 12 || Decision trees. Random Forest || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_12/trees.ipynb notebook] || || | | 12 || Decision trees. Random Forest || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_12/trees.ipynb notebook] || || | ||
Строка 83: | Строка 83: | ||
| 14 || Dimension reduction. PCA, SVD || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_14/ notebook] || || | | 14 || Dimension reduction. PCA, SVD || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_14/ notebook] || || | ||
|- | |- | ||
− | | 15 || Clustering. Kmeans, DBSCAN, Agglomerative clustering || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/ notebook] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/data.zip data] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/hw_titanic.ipynb | + | | 15 || Clustering. Kmeans, DBSCAN, Agglomerative clustering || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/ notebook] || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/data.zip data] [https://github.com/thedenaas/hse_seminars/blob/master/seminar_15/hw_titanic.ipynb Assignment 9]|| 22.12.2017 12.00 |
|- | |- | ||
− | | 16 || Topic modeing || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_16/ notebook] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 | + | | 16 || Topic modeing || || [https://github.com/thedenaas/hse_seminars/blob/master/seminar_16/ notebook] || [http://wiki.cs.hse.ru/Программирование_(python)_для_лингвистов_дз#tasks%201 Assignment 10] || 24.01.2018 12.00 |
|- | |- | ||
|} | |} |
Версия 13:58, 12 января 2018
Содержание
О курсе
Курс читается для студентов лингвистов 4-го курса факультета гуманитарных наук.
Проводится с 2017 года.
Преподаватель: Денис Литвинов (Почта, Telegram )
Ассистент Елизавета Корнеева (Почта)
Практические занятия проходят по средам 9:00-10:20 + 2 занятия в четверг (смотрите расписание)
Правила выставления оценок
итоговая оценка = 0.7*накопленная + 0.3*экзамен
накопленная оценка — средняя по всем дз
- Домашнее задание оценивается по 10-балльной шкале.
- В случае пропуска дедлайна за каждый пропущенный день снимается 1 балл, пока балл >= 3. Затем, за каждый пропущенный день снимаются по 0.5 балла.
- Дедлайны для каждой домашней работы указываются отдельно.
- В оценке домашнего задания оцениваются: работоспособность программы, использование изложенных средств и методов.
- При оценивании программы в первую очередь обращается внимание на то, насколько её работа соответствует требованиям, описанным в задании. Программа, не запускающаяся из-за синтаксических ошибок, не может получить оценку выше 4 баллов. Баллы могут сниматься, в частности, за неточное выполнение задания и отсутствие разбора случаев, из-за которых при исполнении программы может произойти ошибка. Так же оценивается оптимальность решенения (в смысле времени работы и потребляемой памяти). Во вторую очередь оценивается стиль кода.
- При обнаружении плагиата в домашнем или контрольном задании это задание получает оценку 0 баллов.
- Экзамен проводится в письменной форме.
Рекомендуемая литература
- Кормен. Алгоритмы: построение и анализ
- Bishop. Pattern Recognition and Machine Learning
- Jurafsky. Speech and Language Processing
- Barber. Bayesian Reasoning and Machine Learning
Программные средства
- редактор кода sublime text / notepad++ / PyCharm
- jupyter notebook
- numpy, scipy, pandas, matplotlib, seaborn, plotly, scikit-learn, gensim, xgboost
Правила сдачи домашних заданий
Домашние задания сдаются по умолчанию в репозиториях, указанных в форме (пожалуйста, пройдите этот опрос)
!!!
- Соблюдайте именование каталогов, классов и сигнатур функций! В противном случае автотесты их не подцепят и ваше решение не будет засчитано.
- Если явно не сказано, то в скрипте должен присутствовать только код класса/функции, без демонстрации их вызовов с какими либо аргументами.
- Если явно не сказано, в репозиторий вы грузите скрипты с раширением *.py или ноутбуки *.ipynb. (Но никак не архивы)
- Опоздание считается по последнему сданному заданию в домашней работе
Оценки за домашние задания
Семинары
№ | Тема семинара | презентация | материалы семинара | домашнее задание | дедлайн |
---|---|---|---|---|---|
1 | Объекто-ориентированное программирование | notebook | Assignment 1 | 12.09.17 12:00 | |
2 | Паттерны проектирования & web mining, part 1 | notebooks | Assignment 2 | 17.10.17 12:00 | |
3 | Тестирование и профилирование программ | notebooks | Assignment 3 | 17.10.17 12:00 | |
4 | Алгоритм Рабина-Карпа | notebooks | Assignment 4 | 10.10.17 12:00 | |
5 | Scientific libraries: Numpy, scipy, matplotlib | notebooks | |||
6 | Scientific libraries: pandas, plotly | notebooks | |||
7 | Linear Regression | notes and Assignment 5 | 18.10.17 12:00 | ||
8 | Regularization in linear models | ||||
9 | Classification with linear models | data | Assignment 6 | 11.11.17 12:00 | |
10 | SVM | ||||
11 | Word embeddings | notebook datasets | Assignment 7 Assignment 8 | 3.12.17 12:00 | |
12 | Decision trees. Random Forest | notebook | |||
13 | Boosting | notebook | |||
14 | Dimension reduction. PCA, SVD | notebook | |||
15 | Clustering. Kmeans, DBSCAN, Agglomerative clustering | notebook | data Assignment 9 | 22.12.2017 12.00 | |
16 | Topic modeing | notebook | Assignment 10 | 24.01.2018 12.00 |