Анализ данных в Python 2020-2021 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 38: Строка 38:
 
|| ДЗ1: Python || 1.10 23.59 || TBA  
 
|| ДЗ1: Python || 1.10 23.59 || TBA  
 
|-
 
|-
|| ДЗ2 || TBA  || TBA  
+
|| ДЗ2: Pandas & Viz || TBA  || TBA  
 
|-
 
|-
|| ДЗ3 || TBA  || TBA  
+
|| ДЗ3: KNN || TBA  || TBA  
 
|-
 
|-
|| ДЗ4 || TBA  || TBA  
+
|| ДЗ4: ML || TBA  || TBA  
 
|-
 
|-
  

Версия 00:39, 27 октября 2020

О курсе

"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.

Преподаватель

Рогович Татьяна Владимировна

Ассистент

Инсан-Александр Латыпов

  • @Le_Figaro в Telegram

Материалы курса

Дистрибутив для установки Anaconda на собственные компьютеры Пожалуйста, устанавливайте версию Python 3.7 и выше.

Лекции и семинары

Записи занятий на youtube: жмяк

Лекции и семинары

Дата Блокноты Данные Доп. материалы
17.09, 24.09 Python Refresher Блокноты Задачи и решения
1.10 Numpy. Pandas. Блокноты titanic.csv

Домашние задания

Домашние задания находим в проектах в ЛМС и там же сдаем.

ДЗ Дедлайн Решение
ДЗ1: Python 1.10 23.59 TBA
ДЗ2: Pandas & Viz TBA TBA
ДЗ3: KNN TBA TBA
ДЗ4: ML TBA TBA

Контрольные работы

КР ДАТА Тестовый вариант
КР1: Python 8.10 11:10 Жмяк
КР2: Анализ данных и ML 18.12

КР1

  • Проводится во время занятия по расписанию.
  • Тест и задачи будут опубликованы на online.hse.ru (проверьте логины заранее, мы не сможем вам оперативно помочь!)
  • Задания по типу и количеству аналогичны демонстрационному варианту.
  • Во время контрольной у вас должна быть включена камера в zoom и предоставлен доступ к экрану (прокторинг нашими силами на минималках).

Дополнительные баллы

У студентов есть возможность получить до полутора дополнительных баллов за выполнение необязательных заданий в течение семестра. Дополнительные баллы учитываются в итоговой оценке до округления с весом 1. Обратите внимания, что дополнительные задания, выполненные в рамках онлайн курса засчитываются только при условии прохождения исключительно с корпоративного почтового адреса студента. Подключение студентов к онлайн курсу на платформе НПОО (https://openedu.ru/) производит Дирекция по онлайн обучению НИУ ВШЭ по заявке администратора учебного офиса образовательной программы. Скрытая сессия для студентов ВШЭ автоматически появляется в личном аккаунте на платформе. Регистрироваться на открытую сессию для всех желающих слушателей нельзя. На платформе DataCamp слушатели приглашаются в специальную сессию, созданную преподавателем курса.

Всего за семестр будет дано 10 небольших заданий. У каждого свой дедлайн. Задания будут выложены на вики и в ЛМС, решенные блокноты принимаются в ЛМС. После дедлайна задания не принимаются. В качестве некоторых заданий будет предложено пройти часть онлайн курса или выполнить его задания. Оценка за задание не ставится, задание считается выполненным, если оно выполено на 100% (допускаются небольшие помарки, в этом случае выполнение засчитывается на усмотрение преподавателя).

Дополнительные баллы рассчитываются по следующей формуле:

  • 8+: 1.5 балла
  • 5-7: 1 балл
  • <5: 0 баллов

Баллы прибавляются к итоговой оценке до округления.

Экзамен

TBA

Оценка

Окончательная оценка = Округление(0.35 * среднее(Домашние задания) + 0.35 * среднее(Контрольные работы) + 0.3 * Экзамен)

Домашние задания выдаются по темам: программирование на Python, скрейпинг, визуализация, реализация алгоритма kNN. Контрольные работы по темам: программирование на Python, работа с данными Pandas.

Формат контрольных работ пока не определен (очно или дистанционно), будет сообщено позднее.

Преподаватель оставляет за собой право изменить темы домашних и контрольных работы, а также устроить устную защиту любой из форм контроля.

Домашнее задание должно быть сдано до установленного дедлайна. В случае сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Работы, сданные позже, не принимаются и за них выставляется оценка «0».

Список рекомендуемых материалов

Линейная алгебра и статистика

Python

Machine learning

Материала по ML

Статистика

  • Бослав С. Статистика для всех (Есть в библиотеке)
  • Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)

Web scraping