Анализ данных в Python 2019-2020 — различия между версиями
Rogovich (обсуждение | вклад) |
Rogovich (обсуждение | вклад) |
||
Строка 23: | Строка 23: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
− | ! Неделя !! № !! Тема !! | + | ! Неделя !! № !! Тема !! Блокноты !! Данные !! Доп. материалы |
|- | |- | ||
− | || 9-15 сентября || 1-2 || Введение. Refresher: синтаксис Python для анализа данных || [https://docs.google.com/presentation/d/1ejcX-u8TDY7VZrtZMXyUOeOCeSMTcHArQp0LGri5YeE/edit?usp=sharing Презентация] [Блокнот по синтаксису] [Задачи для тренировки] || [http://math-info.hse.ru/2018-19/%D0%9E%D1%81%D0%BD%D0%BE%D0%B2%D1%8B_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_%D0%B2_Python Вики-страница курса "Основы программирования в Python"] [https://courses.openedu.ru/courses/course-v1:hse+PYTHON+fall_2019/info Курс "Python для обработки и извлечения данных"] [http://nbviewer.math-hse.info/github/ischurov/pythonhse/blob/master/Lecture%205.ipynb Блокнот И. Щурова про словари, списковые включения, функцию map] | + | || 9-15 сентября || 1-2 || Введение. Refresher: синтаксис Python для анализа данных || [https://docs.google.com/presentation/d/1ejcX-u8TDY7VZrtZMXyUOeOCeSMTcHArQp0LGri5YeE/edit?usp=sharing Презентация] [Блокнот по синтаксису] [Задачи для тренировки] || [https://github.com/rogovich/2019-2020_PolSci_Data_Analysis_in_Python/blob/master/titanic.csv Титаник] [http://www.py4inf.com/code/romeo-full.txt Romeo] [http://www.py4inf.com/code/mbox.txt Mbox]|| [http://math-info.hse.ru/2018-19/%D0%9E%D1%81%D0%BD%D0%BE%D0%B2%D1%8B_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D1%8F_%D0%B2_Python Вики-страница курса "Основы программирования в Python"] [https://courses.openedu.ru/courses/course-v1:hse+PYTHON+fall_2019/info Курс "Python для обработки и извлечения данных"] [http://nbviewer.math-hse.info/github/ischurov/pythonhse/blob/master/Lecture%205.ipynb Блокнот И. Щурова про словари, списковые включения, функцию map] |
|- | |- | ||
|} | |} |
Версия 11:40, 11 сентября 2019
Содержание
О курсе
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
Преподаватель
Рогович Татьяна Владимировна
Ассистент
Инсан-Александр Латыпов
@Le_Figaro в Telegram
Материалы курса
Дистрибутив для установки Anaconda на собственные компьютеры
Пожалуйста, устанавливайте версию Python 3.7 и выше.
Лекции и семинары
Лекции и семинары
Неделя | № | Тема | Блокноты | Данные | Доп. материалы |
---|---|---|---|---|---|
9-15 сентября | 1-2 | Введение. Refresher: синтаксис Python для анализа данных | Презентация [Блокнот по синтаксису] [Задачи для тренировки] | Титаник Romeo Mbox | Вики-страница курса "Основы программирования в Python" Курс "Python для обработки и извлечения данных" Блокнот И. Щурова про словари, списковые включения, функцию map |
Контрольные работы и домашние задания
Дата | Тема | Файлы | Оценки |
---|---|---|---|
TBA | Контрольная работа по синтаксису Python для решения задач | ||
TBA | Контрольная работа по работе с данными в pandas | ||
TBA | Домашнее задание 1: сбор, анализ и визуализация данных | ||
TBA | Домашнее задание 2: скрейпинг, обработка и анализ текста |
Экзамен
TBA
Оценка
Окончательная оценка = Округление(0.7 * ((КР1 + КР2 + ДЗ1 + ДЗ2) / 4) + 0.3 * Проект + ДБ)
Преподаватель оставляет за собой право устроить устную защиту любой из форм контроля.
Домашнее задание должно быть сдано до установленного дедлайна. В случае сдачи в течение суток после дедлайна, оценка снижается на 1 балл. В случае сдачи в течение недели после дедлайна, оценка снижается на 2 балла. Работы, сданные позже, не принимаются и за них выставляется оценка «0».
Дополнительные баллы. У студентов есть возможность получить до трех дополнительных баллов за выполнение необязательных заданий в течение семестра. Дополнительные баллы учитываются в итоговой оценке до округления с весом 1. Обратите внимания, что дополнительные задания, выполненные в рамках онлайн курса засчитываются только при условии прохождения исключительно с корпоративного почтового адреса студента. Подключение студентов к онлайн курсу на платформе НПОО (https://openedu.ru/) производит Дирекция по онлайн обучению НИУ ВШЭ по заявке администратора учебного офиса образовательной программы. Скрытая сессия для студентов ВШЭ автоматически появляется в личном аккаунте на платформе. Регистрироваться на открытую сессию для всех желающих слушателей нельзя. На платформе DataCamp слушатели приглашаются в специальную сессию, созданную преподавателем курса.
Список рекомендуемых материалов
Линейная алгебра и статистика
- Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
- Lavine. (2013). Introduction to Statistical Thought
- MIT Open course: Linear Algebra by Strang
Python
- Pandas Cheat Sheet
- Python RegExp Cheat Sheet
- O'Reilly: Python for Data Analysis
- Базовый курс по программированию на Stepik
Machine learning
- Bishop. (2006). Pattern Recognition and Machine Learning
- Курс по машинному обучению К.В. Воронцова
- Coursera: Machine Learning by Andrew Ng
- O'Reilly: Machine Learning for Hackers
Материала по ML
- Simple Decision Tree
- Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists
Статистика
- Бослав С. Статистика для всех (Есть в библиотеке)
- Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)