Анализ данных в Python 2019-2020

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.

Преподаватель

Рогович Татьяна Владимировна

Ассистент

Инсан-Александр Латыпов

@Le_Figaro в Telegram

Материалы курса

Дистрибутив для установки Anaconda на собственные компьютеры

Пожалуйста, устанавливайте версию Python 3.7 и выше.

Лекции и семинары

Лекции и семинары

Неделя Тема Блокноты Данные Доп. материалы
9-15 сентября 1-2 Введение. Refresher: синтаксис Python для анализа данных Презентация [Блокнот по синтаксису] [Задачи для тренировки] Титаник Romeo Mbox Вики-страница курса "Основы программирования в Python" Курс "Python для обработки и извлечения данных" Блокнот И. Щурова про словари, списковые включения, функцию map

Контрольные работы и домашние задания

Дата Тема Файлы Оценки
TBA Контрольная работа по синтаксису Python для решения задач
TBA Контрольная работа по работе с данными в pandas
TBA Домашнее задание 1: сбор, анализ и визуализация данных
TBA Домашнее задание 2: скрейпинг, обработка и анализ текста

Экзамен

TBA

Оценка

Окончательная оценка = Округление(0.7 * ((КР1 + КР2 + ДЗ1 + ДЗ2) / 4) + 0.3 * Проект + ДБ)

Преподаватель оставляет за собой право устроить устную защиту любой из форм контроля.

Домашнее задание должно быть сдано до установленного дедлайна. В случае сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Работы, сданные позже, не принимаются и за них выставляется оценка «0».

Дополнительные баллы. У студентов есть возможность получить до трех дополнительных баллов за выполнение необязательных заданий в течение семестра. Дополнительные баллы учитываются в итоговой оценке до округления с весом 1. Обратите внимания, что дополнительные задания, выполненные в рамках онлайн курса засчитываются только при условии прохождения исключительно с корпоративного почтового адреса студента. Подключение студентов к онлайн курсу на платформе НПОО (https://openedu.ru/) производит Дирекция по онлайн обучению НИУ ВШЭ по заявке администратора учебного офиса образовательной программы. Скрытая сессия для студентов ВШЭ автоматически появляется в личном аккаунте на платформе. Регистрироваться на открытую сессию для всех желающих слушателей нельзя. На платформе DataCamp слушатели приглашаются в специальную сессию, созданную преподавателем курса.

Список рекомендуемых материалов

Линейная алгебра и статистика

Python

Machine learning

Материала по ML

Статистика

  • Бослав С. Статистика для всех (Есть в библиотеке)
  • Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)

Web scraping