Анализ данных в Python (Политологи 1 семестр 1-2 модули) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показаны 62 промежуточные версии 2 участников)
Строка 2: Строка 2:
 
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
 
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
  
[https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack]
+
*[https://www.hse.ru/edu/courses/219903928 Карточка курса и программа]
 +
*[https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack]
  
==Преподаватель==
+
==Организаторы==
Рогович Татьяна Владимировна
+
  
 +
''Лектор и семинарист'': Рогович Татьяна Владимировна
 
* [mailto:rogovich@gmail.com E-mail]
 
* [mailto:rogovich@gmail.com E-mail]
 +
 +
''Ассистент'': Гергель Анастасия Игоревна
 +
* [mailto:anastasia.gergel@gmail.com E-mail]
  
 
== Материалы курса ==
 
== Материалы курса ==
 
===Лекции===
 
===Лекции===
 +
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
 
! № !! Дата лекции!! Тема !! Презентация
 
! № !! Дата лекции!! Тема !! Презентация
 
|-
 
|-
| 1 || 4 сентября 2018 г. || Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python || TBC
+
| 1 || 4 сентября 2018 г. || Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python || [https://docs.google.com/presentation/d/1stMDaiKGKpKL5LEP_3kmmZ6gGVuPCl5WMw2pIZERVX4/edit#slide=id.p Лекция 1]
 
|-
 
|-
| 2 || 4 сентября 2018 г. || TBC || TBC 
+
| 2 || 6 сентября 2018 г. || Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними  || см. материалы к семинару
 
|-
 
|-
| 3 || 6 сентября 2018 г. || TBC || TBC
+
| 3 || 20 сентября 2018 г. || Введение в Pandas: Базовые принципы работы модуля || [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
|-  
+
| 4 || 15 сентября 2018 г. || TBC ||  TBC
+
 
|-
 
|-
| 5 || 20 сентября 2018 г. || TBC || TBC
+
| 4 || 15 ноября 2018 г. || Введение в Machine Learning. Решающие деревья.  || [https://docs.google.com/presentation/d/10BvYWG5OEuAbSAPuPKegvANyR-BziwhJSKNvkYDqSBY/edit?usp=sharing Лекция]
 
|-
 
|-
| 6 || 27 сентября 2018 г. || TBC || TBC
+
| 5 || 22 ноября 2018 г. || Анализ текстов || [https://docs.google.com/presentation/d/1b98fzleX9NfJvnLnZ3GB8FBAZUBQW35Z_h-fx30Fkco/edit?usp=sharing Лекция]
|-
+
| 7 || 4 октября 2018 г. || TBC || TBC
+
|-
+
| 8 || 6 октября 2018 г.  || TBC || TBC
+
|-
+
| 9 || 11 октября 2018 г.  || TBC || TBC
+
|-
+
| 10 || 1 ноября 2018 г. || TBC || TBC
+
|-
+
| 11 || 8 ноября 2018 г. || TBC || TBC
+
|-
+
| 12 || 15 ноября 2018 г. || TBC || TBC
+
|-
+
| 13 || 22 ноября 2018 г. || TBC || TBC
+
|-
+
| 14 || 29 ноября 2018 г.  || TBC || TBC
+
|-
+
| 15 || 6 декабря 2018 г.  || TBC || TBC
+
|-
+
| 16 || 13 декабря 2018 г.  || TBC || TBC
+
 
|}
 
|}
  
 
===Семинары===
 
===Семинары===
 +
[https://github.com/MamontRussel/hse_pol Материалы к семинарам]
 +
===Самостоятельные работы и домашнее задание===
  
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
! № !! Дата семинара!! Тема !! Материалы к занятию
+
! № !! Тип !! Дедлайн !! Папка для ответов !! Результаты !! Комментарии
 
|-
 
|-
| 1 || 4 сентября 2018 г. || Основы программирования на языке Python: типы данных и методы работы с ними (переменные, листы, словари, кортежи). || [https://1drv.ms/u/s!Au_p7G0Px2PQg4pxwJ1CeCGz3c76QQ Введение в Python.ipynb]
+
| 1 || [https://docs.google.com/document/d/1EhPmdBQGjPlsvDpkA88zRYU8brUrIb5J16fIYdGCJH8/edit?usp=sharing Домашнее задание №1] || 23.59 7.10.18 || [https://1drv.ms/f/s!Au_p7G0Px2PQg40zBrKf6Y0uTPzo6Q ДЗ 1] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=0 Результаты ДЗ 1] ||
 
|-
 
|-
| 2 || 15 сентября 2018 г. || TBC|| [https://1drv.ms/u/s!Au_p7G0Px2PQg4p1E95VoHKACjQy-A Математика]
+
| 2 || [https://docs.google.com/document/d/1cYtkPh11xbMIT6wEsgamx9T_n7gr2zsDro_rpd_sRMs/edit?usp=sharing Домашнее задание №2] || 23.59 18.11.18 || [mailto:rogovich@gmail.com Ответы высылать на почту] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=1935842168 Результаты ДЗ 2] || [https://1drv.ms/f/s!Au_p7G0Px2PQlZJL8H9MBEAouqgYXA Фидбэк]
 
|-
 
|-
| 3 || 20 сентября 2018 г. || TBC || TBC
+
| 3 || [https://docs.google.com/document/d/1WQTFkXJtxJhwqf8DDHSYuSCqivJCAJhEzlvezVm6B-Y/edit?usp=sharing Домашнее задание №3] || '''23.59 12.12.18''' || [mailto:rogovich@gmail.com Ответы высылать на почту] || ||
|-
+
| 4 || 27 сентября 2018 г. || TBC ||  TBC
+
|-
+
| 5 || 4 октября 2018 г. || TBC || TBC
+
|-
+
| 6 || 6 октября 2018 г. || TBC || TBC
+
|-
+
| 7 || 11 октября 2018 г. || TBC || TBC
+
|-
+
| 8 || 18 октября 2018 г. || TBC || TBC
+
|-
+
| 9 || 1 ноября 2018 г. || TBC || TBC
+
|-
+
| 10 || 8 ноября 2018 г. || TBC || TBC
+
|-
+
| 11 || 15 ноября 2018 г. || TBC  || TBC
+
|-
+
| 12 || 22 ноября 2018 г. || TBC || TBC
+
|-
+
| 13 || 29 ноября 2018 г. || TBC || TBC
+
|-
+
| 14 || 6 декабря 2018 г. || TBC || TBC
+
|-
+
| 15 || 13 декабря 2018 г. || TBC || TBC
+
 
|}
 
|}
  
===Самостоятельные работы и домашнее задание===
+
Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)
  
{| class="wikitable"
+
===Проект===
|-
+
<span style="color:red"><big>'''Дедлайн 20 декабря 12.00'''</big></span> <br>
! № !! Тип !! Дата
+
[https://docs.google.com/document/d/1AVK9-22Ynci_hLsKuN6geOUr0tNgktdEDXvmmvURSeI/edit?usp=sharing Информаци об итоговом проекте]
|-
+
 
| 1 || Домашнее задание №1 || TBA
+
[https://1drv.ms/f/s!Au_p7G0Px2PQlZM9lXfnPns8GXdnNg ПАПКА ДЛЯ ПРОЕКТОВ]
|-
+
 
| 2 || Домашнее задание №2 || TBA
+
===Запись на экзамен===
|-
+
[https://docs.google.com/spreadsheets/d/1iN_-Q94UP_QLxakjCW4BAwh5U46CMUbowClofMTLMM8/edit#gid=0 Запись на экзамен]
| 3 || Домашнее задание №3 || TBA
+
|}
+
  
 
===Материалы===
 
===Материалы===
 +
[https://1drv.ms/u/s!Au_p7G0Px2PQg4p0B4E-1lVKhR7BLQ Тест]
  
[https://1drv.ms/u/s!Au_p7G0Px2PQg4p0B4E-1lVKhR7BLQ Тест]
+
===Опрос===
 +
[https://docs.google.com/forms/d/e/1FAIpQLSe24t7p36TkRZyIoimqZ8DVhaRW8b_92XBeWguHnH5Ufc0ECw/viewform Опрос]
 +
 
 +
===Порядок формирования оценок===
 +
* Оценка за курс накопительная, экзамен не проводится.
 +
* Предусмотрена защита проекта во время сессии.
 +
* Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
 +
* O<sub>результирующая</sub> = 0.6 * O<sub>дз</sub> + 0.4 * О<sub>проект</sub>
 +
 
 +
== Список рекомендуемых материалов ==
 +
 
 +
==== Линейная алгебра и статистика ====
 +
* [https://web.stanford.edu/~hastie/ElemStatLearn/ Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.]
 +
* [http://people.math.umass.edu/~lavine/Book/book.pdf Lavine. (2013). Introduction to Statistical Thought]
 +
* [https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/ MIT Open course: Linear Algebra by Strang]
 +
 
 +
====Python====
 +
* [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
 +
* [http://www.pyregex.com/ Python RegExp Cheat Sheet]
 +
* [http://opencarts.org/sachlaptrinh/pdf/28232.pdf O'Reilly: Python for Data Analysis]
 +
* [https://stepik.org/course/67/syllabus Базовый курс по программированию на Stepik]
  
===Экзамен===
+
==== Machine learning ====
TBC
+
* [http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf Bishop. (2006). Pattern Recognition and Machine Learning]
 +
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]
 +
* [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng]
 +
* [http://shop.oreilly.com/product/0636920018483.do O'Reilly: Machine Learning for Hackers]
  
== Список рекомендуемой литературы ==
+
==== Материала по ML ====
=== Основная литература ===
+
* [https://www.kaggle.com/learn/machine-learning Simple Decision Tree]
 +
* [https://books.google.ru/books?id=vbQlDQAAQBAJ&dq=Introduction+to+Machine+Learning+with+Python:+A+Guide+for+Data+Scientists&hl=ru&source=gbs_navlinks_s Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists]
  
 +
====Статистика====
 +
* Бослав С. Статистика для всех (Есть в библиотеке)
 +
* Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)
  
=== Дополнительная литература ===
+
==== Web scraping ====
 +
* [http://shop.oreilly.com/product/0636920028468.do O'Reilly: RESTful Web APIs]

Текущая версия на 11:51, 24 июля 2019

О курсе

"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.

Организаторы

Лектор и семинарист: Рогович Татьяна Владимировна

Ассистент: Гергель Анастасия Игоревна

Материалы курса

Лекции

Дата лекции Тема Презентация
1 4 сентября 2018 г. Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python Лекция 1
2 6 сентября 2018 г. Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними см. материалы к семинару
3 20 сентября 2018 г. Введение в Pandas: Базовые принципы работы модуля Pandas Cheat Sheet
4 15 ноября 2018 г. Введение в Machine Learning. Решающие деревья. Лекция
5 22 ноября 2018 г. Анализ текстов Лекция

Семинары

Материалы к семинарам

Самостоятельные работы и домашнее задание

Тип Дедлайн Папка для ответов Результаты Комментарии
1 Домашнее задание №1 23.59 7.10.18 ДЗ 1 Результаты ДЗ 1
2 Домашнее задание №2 23.59 18.11.18 Ответы высылать на почту Результаты ДЗ 2 Фидбэк
3 Домашнее задание №3 23.59 12.12.18 Ответы высылать на почту

Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)

Проект

Дедлайн 20 декабря 12.00
Информаци об итоговом проекте

ПАПКА ДЛЯ ПРОЕКТОВ

Запись на экзамен

Запись на экзамен

Материалы

Тест

Опрос

Опрос

Порядок формирования оценок

  • Оценка за курс накопительная, экзамен не проводится.
  • Предусмотрена защита проекта во время сессии.
  • Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
  • Oрезультирующая = 0.6 * Oдз + 0.4 * Опроект

Список рекомендуемых материалов

Линейная алгебра и статистика

Python

Machine learning

Материала по ML

Статистика

  • Бослав С. Статистика для всех (Есть в библиотеке)
  • Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)

Web scraping