Анализ данных в Python 2020-2021 Политология

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

"Анализ данных в Python" читается на 3 курсе, в 3 и 4 модуле.

Преподаватель

Рогович Татьяна Владимировна

Ассистент

Инсан-Александр Латыпов

  • @Le_Figaro в Telegram

Материалы

Записи занятий на youtube: жмяк. Репозиторий с материалами: здесь

Дата Блокноты и презентации Данные Доп. материалы
12.01 Python Refresher Блокноты Задачи и решения
19.01-26.01 RegEx Блокноты Задачи для урока
02.02 Алгоритмы Блокнот
09.02 Классы Блокнот
16.02, 20.03 NumPy. Введение. Pandas Блокнот NumPy Блокнот Pandas Intro Блокнот Datetime Олимпиады Титаник НЛО Задачи NumPyNumPy решенияЗадачи Pandas Pandas Решения
06.04 — 13.04 Визуализация данных. Matplotlib Plotly Forest Data Gapminder Crimes Films Names Задачи


Домашние задания

Домашние задания или публикуются на платформе (online.hse.ru) или находим их в проектах в ЛМС и там же сдаем.

ДЗ Дедлайн Ссылки
ДЗ1: Python 4.02 23.59 Ссылка на ДЗ
ДЗ2: Pandas & Viz 27.04 23.59 Задание ДЗ сдается в ЛМС
ДЗ3: KNN
ДЗ4: ML

Контрольные работы

КР ДАТА Тестовый вариант
КР1: Python 9.02 16.20 - 17.40
КР2: Анализ данных и ML

КР1

  • Проводится во время занятия по расписанию.
  • Тест и задачи будут опубликованы на online.hse.ru (проверьте логины заранее, мы не сможем вам оперативно помочь!)
  • Задания по типу аналогичны дз1.
  • Во время контрольной у вас должна быть включена камера в zoom и предоставлен доступ к экрану (прокторинг нашими силами на минималках).

Дополнительные баллы

Дополнительные баллы рассчитываются по следующей формуле:

  • 8+ заданий: 1.5 балла
  • 5-7 заданий: 1 балл
  • <5 заданий: 0 баллов

У студентов есть возможность получить до полутора дополнительных баллов за выполнение необязательных заданий в течение семестра. Дополнительные баллы учитываются в итоговой оценке до округления с весом 1. На платформе DataCamp слушатели приглашаются в специальную сессию, созданную преподавателем курса.

Всего за семестр будет дано 10 небольших заданий. У каждого свой дедлайн. Задания будут выложены на вики и в ЛМС, решенные блокноты принимаются в ЛМС. После дедлайна задания не принимаются. В качестве некоторых заданий будет предложено пройти часть онлайн курса или выполнить его задания. Оценка за задание не ставится, задание считается выполненным, если оно выполнено на 100% (допускаются небольшие помарки, в этом случае выполнение засчитывается на усмотрение преподавателя).

Номер Тема задания Где искать? Deadline
1 Regular Expressions in Python DataCamp 16.02 23.59
2 Python Data Science Toolbox (Part 1) DataCamp 16.03 23.59
3 Python Data Science Toolbox (Part 2) DataCamp 16.03 23.59
4 Writing Efficient Python Code DataCamp 23.03 23.59

Оценка

Окончательная оценка = Округление(0.45 * среднее(Домашние задания) + 0.35 * среднее(Контрольные работы) + 0.2 * Экзамен)

Домашние задания выдаются по темам: программирование на Python, скрейпинг, визуализация, реализация алгоритма kNN. Контрольные работы по темам: программирование на Python, работа с данными Pandas.

Формат контрольных работ пока не определен (очно или дистанционно), будет сообщено позднее. При дистанционном формате может использоваться процедура прокторинга или аналогичная.

Преподаватель оставляет за собой право изменить темы домашних и контрольных работы, а также устроить устную защиту любой из форм контроля.

Домашнее задание должно быть сдано до установленного дедлайна. В случае сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Обратите внимание, не у всех ДЗ есть поздний дедлайн (будет уточнено). Работы, сданные позже, не принимаются и за них выставляется оценка «0».

Список рекомендуемых материалов

Линейная алгебра и статистика

Python

Machine learning

Материала по ML

Статистика

  • Бослав С. Статистика для всех (Есть в библиотеке)
  • Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)

Web scraping