Анализ данных в Python (Политологи 1 семестр 1-2 модули) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показана одна промежуточная версия 2 участников)
Строка 2: Строка 2:
 
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
 
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
  
[https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack]
+
*[https://www.hse.ru/edu/courses/219903928 Карточка курса и программа]
 +
*[https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack]
  
==Преподаватель==
+
==Организаторы==
Рогович Татьяна Владимировна
+
  
 +
''Лектор и семинарист'': Рогович Татьяна Владимировна
 
* [mailto:rogovich@gmail.com E-mail]
 
* [mailto:rogovich@gmail.com E-mail]
 +
 +
''Ассистент'': Гергель Анастасия Игоревна
 +
* [mailto:anastasia.gergel@gmail.com E-mail]
  
 
== Материалы курса ==
 
== Материалы курса ==
Строка 21: Строка 25:
 
|-
 
|-
 
| 3 || 20 сентября 2018 г. || Введение в Pandas: Базовые принципы работы модуля  || [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
 
| 3 || 20 сентября 2018 г. || Введение в Pandas: Базовые принципы работы модуля  || [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
|}
 
 
===Семинары===
 
 
{| class="wikitable"
 
 
|-
 
|-
! № !! Дата семинара!! Тема !! Материалы к занятию
+
| 4 || 15 ноября 2018 г. || Введение в Machine Learning. Решающие деревья. || [https://docs.google.com/presentation/d/10BvYWG5OEuAbSAPuPKegvANyR-BziwhJSKNvkYDqSBY/edit?usp=sharing Лекция]
|-
+
| 1 || 4 сентября 2018 г. || Основы программирования на языке Python: типы данных и методы работы с ними (переменные, листы, словари, кортежи). || [https://1drv.ms/u/s!Au_p7G0Px2PQg4pxwJ1CeCGz3c76QQ Введение в Python]
+
|-
+
| 2 || 6 сентября 2018 г. || Основы линейной алгебры для анализа данных и реализация математических операций в NumPy|| [https://1drv.ms/u/s!Au_p7G0Px2PQg4p1E95VoHKACjQy-A Математика]
+
|-
+
| 3-4 || 15 сентября 2018 г. || Продвинутый синтаксис Python (итераторы, генераторы списков, функции map() и zip(). Разбор самостоятельного задания || [https://1drv.ms/u/s!Au_p7G0Px2PQg4xChE_z0OAGgxk9TA Advanced Python]
+
[https://1drv.ms/u/s!Au_p7G0Px2PQg4xDe19OYSJwz0D1pQ Ответы на тест]
+
|-
+
| 5 || 20 сентября 2018 г. || Введение в Pandas ||
+
[https://1drv.ms/u/s!Au_p7G0Px2PQg4xFEI8EdJg_z46lIw Monthly Death]
+
<br>[https://1drv.ms/u/s!Au_p7G0Px2PQg4xG6zOV98Oll9vOmQ Yearly Death By Clinic]
+
[https://1drv.ms/t/s!Au_p7G0Px2PQg4xIDw6urHF7Sq33Nw Segismundo]
+
<br>
+
[https://1drv.ms/u/s!Au_p7G0Px2PQg4xJm4Th4JsO91JtsQ Test]
+
<br>
+
[https://1drv.ms/u/s!Au_p7G0Px2PQg4xHQKvXKm2O40jyyQ Train]
+
 
|-
 
|-
 +
| 5 || 22 ноября 2018 г. || Анализ текстов  || [https://docs.google.com/presentation/d/1b98fzleX9NfJvnLnZ3GB8FBAZUBQW35Z_h-fx30Fkco/edit?usp=sharing Лекция]
 
|}
 
|}
  
 +
===Семинары===
 +
[https://github.com/MamontRussel/hse_pol Материалы к семинарам]
 
===Самостоятельные работы и домашнее задание===
 
===Самостоятельные работы и домашнее задание===
  
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
! № !! Тип !! Дата
+
! № !! Тип !! Дедлайн !! Папка для ответов !! Результаты !! Комментарии
 
|-
 
|-
| 1 || Домашнее задание №1 || TBA
+
| 1 || [https://docs.google.com/document/d/1EhPmdBQGjPlsvDpkA88zRYU8brUrIb5J16fIYdGCJH8/edit?usp=sharing Домашнее задание №1] || 23.59 7.10.18 || [https://1drv.ms/f/s!Au_p7G0Px2PQg40zBrKf6Y0uTPzo6Q ДЗ 1] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=0 Результаты ДЗ 1] ||  
 
|-
 
|-
| 2 || Домашнее задание №2 || TBA
+
| 2 || [https://docs.google.com/document/d/1cYtkPh11xbMIT6wEsgamx9T_n7gr2zsDro_rpd_sRMs/edit?usp=sharing Домашнее задание №2] || 23.59 18.11.18 || [mailto:rogovich@gmail.com Ответы высылать на почту] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=1935842168 Результаты ДЗ 2] || [https://1drv.ms/f/s!Au_p7G0Px2PQlZJL8H9MBEAouqgYXA Фидбэк]
 
|-
 
|-
| 3 || Домашнее задание №3 || TBA
+
| 3 || [https://docs.google.com/document/d/1WQTFkXJtxJhwqf8DDHSYuSCqivJCAJhEzlvezVm6B-Y/edit?usp=sharing Домашнее задание №3] || '''23.59 12.12.18''' || [mailto:rogovich@gmail.com Ответы высылать на почту] || ||
 
|}
 
|}
  
===Материалы===
+
Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)
  
 +
===Проект===
 +
<span style="color:red"><big>'''Дедлайн 20 декабря 12.00'''</big></span> <br>
 +
[https://docs.google.com/document/d/1AVK9-22Ynci_hLsKuN6geOUr0tNgktdEDXvmmvURSeI/edit?usp=sharing Информаци об итоговом проекте]
 +
 +
[https://1drv.ms/f/s!Au_p7G0Px2PQlZM9lXfnPns8GXdnNg ПАПКА ДЛЯ ПРОЕКТОВ]
 +
 +
===Запись на экзамен===
 +
[https://docs.google.com/spreadsheets/d/1iN_-Q94UP_QLxakjCW4BAwh5U46CMUbowClofMTLMM8/edit#gid=0 Запись на экзамен]
 +
 +
===Материалы===
 
[https://1drv.ms/u/s!Au_p7G0Px2PQg4p0B4E-1lVKhR7BLQ Тест]
 
[https://1drv.ms/u/s!Au_p7G0Px2PQg4p0B4E-1lVKhR7BLQ Тест]
  
===Экзамен===
+
===Опрос===
TBC
+
[https://docs.google.com/forms/d/e/1FAIpQLSe24t7p36TkRZyIoimqZ8DVhaRW8b_92XBeWguHnH5Ufc0ECw/viewform Опрос]
 +
 
 +
===Порядок формирования оценок===
 +
* Оценка за курс накопительная, экзамен не проводится.
 +
* Предусмотрена защита проекта во время сессии.
 +
* Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
 +
* O<sub>результирующая</sub> = 0.6 * O<sub>дз</sub> + 0.4 * О<sub>проект</sub>
 +
 
 +
== Список рекомендуемых материалов ==
 +
 
 +
==== Линейная алгебра и статистика ====
 +
* [https://web.stanford.edu/~hastie/ElemStatLearn/ Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.]
 +
* [http://people.math.umass.edu/~lavine/Book/book.pdf Lavine. (2013). Introduction to Statistical Thought]
 +
* [https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/ MIT Open course: Linear Algebra by Strang]
 +
 
 +
====Python====
 +
* [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
 +
* [http://www.pyregex.com/ Python RegExp Cheat Sheet]
 +
* [http://opencarts.org/sachlaptrinh/pdf/28232.pdf O'Reilly: Python for Data Analysis]
 +
* [https://stepik.org/course/67/syllabus Базовый курс по программированию на Stepik]
 +
 
 +
==== Machine learning ====
 +
* [http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf Bishop. (2006). Pattern Recognition and Machine Learning]
 +
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]
 +
* [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng]
 +
* [http://shop.oreilly.com/product/0636920018483.do O'Reilly: Machine Learning for Hackers]
  
== Список рекомендуемой литературы ==
+
==== Материала по ML ====
=== Основная литература ===
+
* [https://www.kaggle.com/learn/machine-learning Simple Decision Tree]
 +
* [https://books.google.ru/books?id=vbQlDQAAQBAJ&dq=Introduction+to+Machine+Learning+with+Python:+A+Guide+for+Data+Scientists&hl=ru&source=gbs_navlinks_s Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists]
  
 +
====Статистика====
 +
* Бослав С. Статистика для всех (Есть в библиотеке)
 +
* Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)
  
=== Дополнительная литература ===
+
==== Web scraping ====
 +
* [http://shop.oreilly.com/product/0636920028468.do O'Reilly: RESTful Web APIs]

Текущая версия на 11:51, 24 июля 2019

О курсе

"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.

Организаторы

Лектор и семинарист: Рогович Татьяна Владимировна

Ассистент: Гергель Анастасия Игоревна

Материалы курса

Лекции

Дата лекции Тема Презентация
1 4 сентября 2018 г. Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python Лекция 1
2 6 сентября 2018 г. Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними см. материалы к семинару
3 20 сентября 2018 г. Введение в Pandas: Базовые принципы работы модуля Pandas Cheat Sheet
4 15 ноября 2018 г. Введение в Machine Learning. Решающие деревья. Лекция
5 22 ноября 2018 г. Анализ текстов Лекция

Семинары

Материалы к семинарам

Самостоятельные работы и домашнее задание

Тип Дедлайн Папка для ответов Результаты Комментарии
1 Домашнее задание №1 23.59 7.10.18 ДЗ 1 Результаты ДЗ 1
2 Домашнее задание №2 23.59 18.11.18 Ответы высылать на почту Результаты ДЗ 2 Фидбэк
3 Домашнее задание №3 23.59 12.12.18 Ответы высылать на почту

Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)

Проект

Дедлайн 20 декабря 12.00
Информаци об итоговом проекте

ПАПКА ДЛЯ ПРОЕКТОВ

Запись на экзамен

Запись на экзамен

Материалы

Тест

Опрос

Опрос

Порядок формирования оценок

  • Оценка за курс накопительная, экзамен не проводится.
  • Предусмотрена защита проекта во время сессии.
  • Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
  • Oрезультирующая = 0.6 * Oдз + 0.4 * Опроект

Список рекомендуемых материалов

Линейная алгебра и статистика

Python

Machine learning

Материала по ML

Статистика

  • Бослав С. Статистика для всех (Есть в библиотеке)
  • Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)

Web scraping