Анализ данных в Python 2020-2021 — различия между версиями
Rogovich (обсуждение | вклад) |
Rogovich (обсуждение | вклад) |
||
Строка 54: | Строка 54: | ||
|| КР1: Python || 8.10 11:10 || [https://online.hse.ru/mod/quiz/view.php?id=156049 Жмяк] | || КР1: Python || 8.10 11:10 || [https://online.hse.ru/mod/quiz/view.php?id=156049 Жмяк] | ||
|- | |- | ||
− | || КР2: Анализ данных и ML || | + | || КР2: Анализ данных и ML || 18.12 || |
|- | |- | ||
|} | |} |
Версия 00:38, 27 октября 2020
Содержание
О курсе
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
Преподаватель
Рогович Татьяна Владимировна
Ассистент
Инсан-Александр Латыпов
- @Le_Figaro в Telegram
Материалы курса
Дистрибутив для установки Anaconda на собственные компьютеры Пожалуйста, устанавливайте версию Python 3.7 и выше.
Лекции и семинары
Записи занятий на youtube: жмяк
Лекции и семинары
Дата | № | Блокноты | Данные | Доп. материалы |
---|---|---|---|---|
17.09, 24.09 | Python Refresher | Блокноты | Задачи и решения | |
1.10 | Numpy. Pandas. | Блокноты | titanic.csv |
Домашние задания
Домашние задания находим в проектах в ЛМС и там же сдаем.
ДЗ | Дедлайн | Решение |
---|---|---|
ДЗ1: Python | 1.10 23.59 | TBA |
ДЗ2 | TBA | TBA |
ДЗ3 | TBA | TBA |
ДЗ4 | TBA | TBA |
Контрольные работы
КР | ДАТА | Тестовый вариант |
---|---|---|
КР1: Python | 8.10 11:10 | Жмяк |
КР2: Анализ данных и ML | 18.12 |
КР1
- Проводится во время занятия по расписанию.
- Тест и задачи будут опубликованы на online.hse.ru (проверьте логины заранее, мы не сможем вам оперативно помочь!)
- Задания по типу и количеству аналогичны демонстрационному варианту.
- Во время контрольной у вас должна быть включена камера в zoom и предоставлен доступ к экрану (прокторинг нашими силами на минималках).
Дополнительные баллы
У студентов есть возможность получить до полутора дополнительных баллов за выполнение необязательных заданий в течение семестра. Дополнительные баллы учитываются в итоговой оценке до округления с весом 1. Обратите внимания, что дополнительные задания, выполненные в рамках онлайн курса засчитываются только при условии прохождения исключительно с корпоративного почтового адреса студента. Подключение студентов к онлайн курсу на платформе НПОО (https://openedu.ru/) производит Дирекция по онлайн обучению НИУ ВШЭ по заявке администратора учебного офиса образовательной программы. Скрытая сессия для студентов ВШЭ автоматически появляется в личном аккаунте на платформе. Регистрироваться на открытую сессию для всех желающих слушателей нельзя. На платформе DataCamp слушатели приглашаются в специальную сессию, созданную преподавателем курса.
Всего за семестр будет дано 10 небольших заданий. У каждого свой дедлайн. Задания будут выложены на вики и в ЛМС, решенные блокноты принимаются в ЛМС. После дедлайна задания не принимаются. В качестве некоторых заданий будет предложено пройти часть онлайн курса или выполнить его задания. Оценка за задание не ставится, задание считается выполненным, если оно выполено на 100% (допускаются небольшие помарки, в этом случае выполнение засчитывается на усмотрение преподавателя).
Дополнительные баллы рассчитываются по следующей формуле:
- 8+: 1.5 балла
- 5-7: 1 балл
- <5: 0 баллов
Баллы прибавляются к итоговой оценке до округления.
Экзамен
TBA
Оценка
Окончательная оценка = Округление(0.35 * среднее(Домашние задания) + 0.35 * среднее(Контрольные работы) + 0.3 * Экзамен)
Домашние задания выдаются по темам: программирование на Python, скрейпинг, визуализация, реализация алгоритма kNN. Контрольные работы по темам: программирование на Python, работа с данными Pandas.
Формат контрольных работ пока не определен (очно или дистанционно), будет сообщено позднее.
Преподаватель оставляет за собой право изменить темы домашних и контрольных работы, а также устроить устную защиту любой из форм контроля.
Домашнее задание должно быть сдано до установленного дедлайна. В случае сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Работы, сданные позже, не принимаются и за них выставляется оценка «0».
Список рекомендуемых материалов
Линейная алгебра и статистика
- Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
- Lavine. (2013). Introduction to Statistical Thought
- MIT Open course: Linear Algebra by Strang
Python
- Pandas Cheat Sheet
- Python RegExp Cheat Sheet
- O'Reilly: Python for Data Analysis
- Базовый курс по программированию на Stepik
Machine learning
- Bishop. (2006). Pattern Recognition and Machine Learning
- Курс по машинному обучению К.В. Воронцова
- Coursera: Machine Learning by Andrew Ng
- O'Reilly: Machine Learning for Hackers
Материала по ML
- Simple Decision Tree
- Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists
Статистика
- Бослав С. Статистика для всех (Есть в библиотеке)
- Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)