Анализ данных в Python 2020-2021 Политология
Содержание
О курсе
"Анализ данных в Python" читается на 3 курсе, в 3 и 4 модуле.
Преподаватель
Рогович Татьяна Владимировна
Ассистент
Инсан-Александр Латыпов
- @Le_Figaro в Telegram
Материалы
Записи занятий на youtube: жмяк. Репозиторий с материалами: здесь
Дата | № | Блокноты и презентации | Данные | Доп. материалы |
---|---|---|---|---|
12.01 | Python Refresher | Блокноты | Задачи и решения | |
19.01-26.01 | RegEx | Блокноты | Задачи для урока | |
02.02 | Алгоритмы | Блокнот | ||
09.02 | Классы | Блокнот | ||
16.02, 20.03 | NumPy. Введение. Pandas | Блокнот NumPy Блокнот Pandas Intro Блокнот Datetime | Олимпиады Титаник НЛО | Задачи NumPyNumPy решенияЗадачи Pandas Pandas Решения |
06.04 — 13.04 | Визуализация данных. | Matplotlib Plotly | Forest Data Gapminder Crimes Films Names | Задачи |
Домашние задания
Домашние задания или публикуются на платформе (online.hse.ru) или находим их в проектах в ЛМС и там же сдаем.
ДЗ | Дедлайн | Ссылки |
---|---|---|
ДЗ1: Python | 4.02 23.59 | Ссылка на ДЗ |
ДЗ2: Pandas & Viz | 27.04 23.59 | Задание ДЗ сдается в ЛМС |
ДЗ3: KNN | ||
ДЗ4: ML |
Контрольные работы
КР | ДАТА | Тестовый вариант |
---|---|---|
КР1: Python | 9.02 16.20 - 17.40 | |
КР2: Анализ данных и ML |
КР1
- Проводится во время занятия по расписанию.
- Тест и задачи будут опубликованы на online.hse.ru (проверьте логины заранее, мы не сможем вам оперативно помочь!)
- Задания по типу аналогичны дз1.
- Во время контрольной у вас должна быть включена камера в zoom и предоставлен доступ к экрану (прокторинг нашими силами на минималках).
Дополнительные баллы
Дополнительные баллы рассчитываются по следующей формуле:
- 8+ заданий: 1.5 балла
- 5-7 заданий: 1 балл
- <5 заданий: 0 баллов
У студентов есть возможность получить до полутора дополнительных баллов за выполнение необязательных заданий в течение семестра. Дополнительные баллы учитываются в итоговой оценке до округления с весом 1. На платформе DataCamp слушатели приглашаются в специальную сессию, созданную преподавателем курса.
Всего за семестр будет дано 10 небольших заданий. У каждого свой дедлайн. Задания будут выложены на вики и в ЛМС, решенные блокноты принимаются в ЛМС. После дедлайна задания не принимаются. В качестве некоторых заданий будет предложено пройти часть онлайн курса или выполнить его задания. Оценка за задание не ставится, задание считается выполненным, если оно выполнено на 100% (допускаются небольшие помарки, в этом случае выполнение засчитывается на усмотрение преподавателя).
Номер | Тема задания | Где искать? | Deadline |
---|---|---|---|
1 | Regular Expressions in Python | DataCamp | 16.02 23.59 |
2 | Python Data Science Toolbox (Part 1) | DataCamp | 16.03 23.59 |
3 | Python Data Science Toolbox (Part 2) | DataCamp | 16.03 23.59 |
4 | Writing Efficient Python Code | DataCamp | 23.03 23.59 |
Оценка
Окончательная оценка = Округление(0.45 * среднее(Домашние задания) + 0.35 * среднее(Контрольные работы) + 0.2 * Экзамен)
Домашние задания выдаются по темам: программирование на Python, скрейпинг, визуализация, реализация алгоритма kNN. Контрольные работы по темам: программирование на Python, работа с данными Pandas.
Формат контрольных работ пока не определен (очно или дистанционно), будет сообщено позднее. При дистанционном формате может использоваться процедура прокторинга или аналогичная.
Преподаватель оставляет за собой право изменить темы домашних и контрольных работы, а также устроить устную защиту любой из форм контроля.
Домашнее задание должно быть сдано до установленного дедлайна. В случае сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Обратите внимание, не у всех ДЗ есть поздний дедлайн (будет уточнено). Работы, сданные позже, не принимаются и за них выставляется оценка «0».
Список рекомендуемых материалов
Линейная алгебра и статистика
- Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
- Lavine. (2013). Introduction to Statistical Thought
- MIT Open course: Linear Algebra by Strang
Python
- Pandas Cheat Sheet
- Python RegExp Cheat Sheet
- O'Reilly: Python for Data Analysis
- Базовый курс по программированию на Stepik
Machine learning
- Bishop. (2006). Pattern Recognition and Machine Learning
- Курс по машинному обучению К.В. Воронцова
- Coursera: Machine Learning by Andrew Ng
- O'Reilly: Machine Learning for Hackers
Материала по ML
- Simple Decision Tree
- Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists
Статистика
- Бослав С. Статистика для всех (Есть в библиотеке)
- Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)