Анализ данных в Python (Политологи 1 семестр 1-2 модули) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Rogovich (обсуждение | вклад) |
Rogovich (обсуждение | вклад) |
||
(не показано 70 промежуточных версии 2 участников) | |||
Строка 2: | Строка 2: | ||
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле. | "Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле. | ||
− | [https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack] | + | *[https://www.hse.ru/edu/courses/219903928 Карточка курса и программа] |
+ | *[https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack] | ||
− | == | + | ==Организаторы== |
− | + | ||
+ | ''Лектор и семинарист'': Рогович Татьяна Владимировна | ||
* [mailto:rogovich@gmail.com E-mail] | * [mailto:rogovich@gmail.com E-mail] | ||
+ | |||
+ | ''Ассистент'': Гергель Анастасия Игоревна | ||
+ | * [mailto:anastasia.gergel@gmail.com E-mail] | ||
== Материалы курса == | == Материалы курса == | ||
===Лекции=== | ===Лекции=== | ||
+ | |||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
! № !! Дата лекции!! Тема !! Презентация | ! № !! Дата лекции!! Тема !! Презентация | ||
|- | |- | ||
− | | 1 || 4 сентября 2018 г. || Введение в | + | | 1 || 4 сентября 2018 г. || Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python || [https://docs.google.com/presentation/d/1stMDaiKGKpKL5LEP_3kmmZ6gGVuPCl5WMw2pIZERVX4/edit#slide=id.p Лекция 1] |
|- | |- | ||
− | | 2 || | + | | 2 || 6 сентября 2018 г. || Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними || см. материалы к семинару |
|- | |- | ||
− | | 3 || | + | | 3 || 20 сентября 2018 г. || Введение в Pandas: Базовые принципы работы модуля || [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet] |
− | + | ||
− | + | ||
|- | |- | ||
− | | | + | | 4 || 15 ноября 2018 г. || Введение в Machine Learning. Решающие деревья. || [https://docs.google.com/presentation/d/10BvYWG5OEuAbSAPuPKegvANyR-BziwhJSKNvkYDqSBY/edit?usp=sharing Лекция] |
|- | |- | ||
− | | | + | | 5 || 22 ноября 2018 г. || Анализ текстов || [https://docs.google.com/presentation/d/1b98fzleX9NfJvnLnZ3GB8FBAZUBQW35Z_h-fx30Fkco/edit?usp=sharing Лекция] |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
|} | |} | ||
===Семинары=== | ===Семинары=== | ||
+ | [https://github.com/MamontRussel/hse_pol Материалы к семинарам] | ||
+ | ===Самостоятельные работы и домашнее задание=== | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
− | ! № !! | + | ! № !! Тип !! Дедлайн !! Папка для ответов !! Результаты !! Комментарии |
|- | |- | ||
− | | 1 || | + | | 1 || [https://docs.google.com/document/d/1EhPmdBQGjPlsvDpkA88zRYU8brUrIb5J16fIYdGCJH8/edit?usp=sharing Домашнее задание №1] || 23.59 7.10.18 || [https://1drv.ms/f/s!Au_p7G0Px2PQg40zBrKf6Y0uTPzo6Q ДЗ 1] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=0 Результаты ДЗ 1] || |
|- | |- | ||
− | | 2 || | + | | 2 || [https://docs.google.com/document/d/1cYtkPh11xbMIT6wEsgamx9T_n7gr2zsDro_rpd_sRMs/edit?usp=sharing Домашнее задание №2] || 23.59 18.11.18 || [mailto:rogovich@gmail.com Ответы высылать на почту] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=1935842168 Результаты ДЗ 2] || [https://1drv.ms/f/s!Au_p7G0Px2PQlZJL8H9MBEAouqgYXA Фидбэк] |
|- | |- | ||
− | | 3 || | + | | 3 || [https://docs.google.com/document/d/1WQTFkXJtxJhwqf8DDHSYuSCqivJCAJhEzlvezVm6B-Y/edit?usp=sharing Домашнее задание №3] || '''23.59 12.12.18''' || [mailto:rogovich@gmail.com Ответы высылать на почту] || || |
− | + | ||
− | + | ||
− | + | ||
− | | | + | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
|} | |} | ||
− | + | Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb) | |
− | + | ===Проект=== | |
− | + | <span style="color:red"><big>'''Дедлайн 20 декабря 12.00'''</big></span> <br> | |
− | ! | + | [https://docs.google.com/document/d/1AVK9-22Ynci_hLsKuN6geOUr0tNgktdEDXvmmvURSeI/edit?usp=sharing Информаци об итоговом проекте] |
− | + | ||
− | + | [https://1drv.ms/f/s!Au_p7G0Px2PQlZM9lXfnPns8GXdnNg ПАПКА ДЛЯ ПРОЕКТОВ] | |
− | + | ||
− | + | ===Запись на экзамен=== | |
− | + | [https://docs.google.com/spreadsheets/d/1iN_-Q94UP_QLxakjCW4BAwh5U46CMUbowClofMTLMM8/edit#gid=0 Запись на экзамен] | |
− | + | ||
− | + | ||
===Материалы=== | ===Материалы=== | ||
+ | [https://1drv.ms/u/s!Au_p7G0Px2PQg4p0B4E-1lVKhR7BLQ Тест] | ||
+ | |||
+ | ===Опрос=== | ||
+ | [https://docs.google.com/forms/d/e/1FAIpQLSe24t7p36TkRZyIoimqZ8DVhaRW8b_92XBeWguHnH5Ufc0ECw/viewform Опрос] | ||
+ | |||
+ | ===Порядок формирования оценок=== | ||
+ | * Оценка за курс накопительная, экзамен не проводится. | ||
+ | * Предусмотрена защита проекта во время сессии. | ||
+ | * Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке. | ||
+ | * O<sub>результирующая</sub> = 0.6 * O<sub>дз</sub> + 0.4 * О<sub>проект</sub> | ||
+ | |||
+ | == Список рекомендуемых материалов == | ||
+ | |||
+ | ==== Линейная алгебра и статистика ==== | ||
+ | * [https://web.stanford.edu/~hastie/ElemStatLearn/ Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.] | ||
+ | * [http://people.math.umass.edu/~lavine/Book/book.pdf Lavine. (2013). Introduction to Statistical Thought] | ||
+ | * [https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/ MIT Open course: Linear Algebra by Strang] | ||
− | [https:// | + | ====Python==== |
+ | * [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet] | ||
+ | * [http://www.pyregex.com/ Python RegExp Cheat Sheet] | ||
+ | * [http://opencarts.org/sachlaptrinh/pdf/28232.pdf O'Reilly: Python for Data Analysis] | ||
+ | * [https://stepik.org/course/67/syllabus Базовый курс по программированию на Stepik] | ||
− | === | + | ==== Machine learning ==== |
− | + | * [http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf Bishop. (2006). Pattern Recognition and Machine Learning] | |
+ | * [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова] | ||
+ | * [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng] | ||
+ | * [http://shop.oreilly.com/product/0636920018483.do O'Reilly: Machine Learning for Hackers] | ||
− | == | + | ==== Материала по ML ==== |
− | === | + | * [https://www.kaggle.com/learn/machine-learning Simple Decision Tree] |
+ | * [https://books.google.ru/books?id=vbQlDQAAQBAJ&dq=Introduction+to+Machine+Learning+with+Python:+A+Guide+for+Data+Scientists&hl=ru&source=gbs_navlinks_s Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists] | ||
+ | ====Статистика==== | ||
+ | * Бослав С. Статистика для всех (Есть в библиотеке) | ||
+ | * Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке) | ||
− | === | + | ==== Web scraping ==== |
+ | * [http://shop.oreilly.com/product/0636920028468.do O'Reilly: RESTful Web APIs] |
Текущая версия на 11:51, 24 июля 2019
О курсе
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
Организаторы
Лектор и семинарист: Рогович Татьяна Владимировна
Ассистент: Гергель Анастасия Игоревна
Материалы курса
Лекции
№ | Дата лекции | Тема | Презентация |
---|---|---|---|
1 | 4 сентября 2018 г. | Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python | Лекция 1 |
2 | 6 сентября 2018 г. | Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними | см. материалы к семинару |
3 | 20 сентября 2018 г. | Введение в Pandas: Базовые принципы работы модуля | Pandas Cheat Sheet |
4 | 15 ноября 2018 г. | Введение в Machine Learning. Решающие деревья. | Лекция |
5 | 22 ноября 2018 г. | Анализ текстов | Лекция |
Семинары
Самостоятельные работы и домашнее задание
№ | Тип | Дедлайн | Папка для ответов | Результаты | Комментарии |
---|---|---|---|---|---|
1 | Домашнее задание №1 | 23.59 7.10.18 | ДЗ 1 | Результаты ДЗ 1 | |
2 | Домашнее задание №2 | 23.59 18.11.18 | Ответы высылать на почту | Результаты ДЗ 2 | Фидбэк |
3 | Домашнее задание №3 | 23.59 12.12.18 | Ответы высылать на почту |
Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)
Проект
Дедлайн 20 декабря 12.00
Информаци об итоговом проекте
Запись на экзамен
Материалы
Опрос
Порядок формирования оценок
- Оценка за курс накопительная, экзамен не проводится.
- Предусмотрена защита проекта во время сессии.
- Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
- Oрезультирующая = 0.6 * Oдз + 0.4 * Опроект
Список рекомендуемых материалов
Линейная алгебра и статистика
- Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
- Lavine. (2013). Introduction to Statistical Thought
- MIT Open course: Linear Algebra by Strang
Python
- Pandas Cheat Sheet
- Python RegExp Cheat Sheet
- O'Reilly: Python for Data Analysis
- Базовый курс по программированию на Stepik
Machine learning
- Bishop. (2006). Pattern Recognition and Machine Learning
- Курс по машинному обучению К.В. Воронцова
- Coursera: Machine Learning by Andrew Ng
- O'Reilly: Machine Learning for Hackers
Материала по ML
- Simple Decision Tree
- Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists
Статистика
- Бослав С. Статистика для всех (Есть в библиотеке)
- Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)