Анализ данных в Python (Политологи 1 семестр 1-2 модули) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Создана страница)
 
 
(не показано 75 промежуточных версии 2 участников)
Строка 1: Строка 1:
Тут будет информация о курсе для политологов
+
== О курсе ==
 +
"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.
 +
 
 +
*[https://www.hse.ru/edu/courses/219903928 Карточка курса и программа]
 +
*[https://join.slack.com/t/dataculture-pol-4/shared_invite/enQtNDI3NzE5OTkyODgzLTRlNThhZTFlZjBjOTdmMGYyNjFmNmQ5OWI3ZGU4NGUzMDdiMzIwOGNiM2JjZGUwZmFiOTQ5MDMwOWY1NWYxZDM Канал курса в Slack]
 +
 
 +
==Организаторы==
 +
 
 +
''Лектор и семинарист'': Рогович Татьяна Владимировна
 +
* [mailto:rogovich@gmail.com E-mail]
 +
 
 +
''Ассистент'': Гергель Анастасия Игоревна
 +
* [mailto:anastasia.gergel@gmail.com E-mail]
 +
 
 +
== Материалы курса ==
 +
===Лекции===
 +
 
 +
{| class="wikitable"
 +
|-
 +
! № !! Дата лекции!! Тема !! Презентация
 +
|-
 +
| 1 || 4 сентября 2018 г. || Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python || [https://docs.google.com/presentation/d/1stMDaiKGKpKL5LEP_3kmmZ6gGVuPCl5WMw2pIZERVX4/edit#slide=id.p Лекция 1]
 +
|-
 +
| 2 || 6 сентября 2018 г. || Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними  || см. материалы к семинару
 +
|-
 +
| 3 || 20 сентября 2018 г. || Введение в Pandas: Базовые принципы работы модуля  || [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
 +
|-
 +
| 4 || 15 ноября 2018 г. || Введение в Machine Learning. Решающие деревья.  || [https://docs.google.com/presentation/d/10BvYWG5OEuAbSAPuPKegvANyR-BziwhJSKNvkYDqSBY/edit?usp=sharing Лекция]
 +
|-
 +
| 5 || 22 ноября 2018 г. || Анализ текстов  || [https://docs.google.com/presentation/d/1b98fzleX9NfJvnLnZ3GB8FBAZUBQW35Z_h-fx30Fkco/edit?usp=sharing Лекция]
 +
|}
 +
 
 +
===Семинары===
 +
[https://github.com/MamontRussel/hse_pol Материалы к семинарам]
 +
===Самостоятельные работы и домашнее задание===
 +
 
 +
{| class="wikitable"
 +
|-
 +
! № !! Тип !! Дедлайн !! Папка для ответов !! Результаты !! Комментарии
 +
|-
 +
| 1 || [https://docs.google.com/document/d/1EhPmdBQGjPlsvDpkA88zRYU8brUrIb5J16fIYdGCJH8/edit?usp=sharing Домашнее задание №1] || 23.59 7.10.18 || [https://1drv.ms/f/s!Au_p7G0Px2PQg40zBrKf6Y0uTPzo6Q ДЗ 1] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=0 Результаты ДЗ 1] ||
 +
|-
 +
| 2 || [https://docs.google.com/document/d/1cYtkPh11xbMIT6wEsgamx9T_n7gr2zsDro_rpd_sRMs/edit?usp=sharing Домашнее задание №2] || 23.59 18.11.18 || [mailto:rogovich@gmail.com Ответы высылать на почту] || [https://docs.google.com/spreadsheets/d/1r7wR3Ab0NmwblkI07Xy2DyShrOhsEka5741RPhW2nv4/edit#gid=1935842168 Результаты ДЗ 2] || [https://1drv.ms/f/s!Au_p7G0Px2PQlZJL8H9MBEAouqgYXA Фидбэк]
 +
|-
 +
| 3 || [https://docs.google.com/document/d/1WQTFkXJtxJhwqf8DDHSYuSCqivJCAJhEzlvezVm6B-Y/edit?usp=sharing Домашнее задание №3] || '''23.59 12.12.18''' || [mailto:rogovich@gmail.com Ответы высылать на почту] || ||
 +
|}
 +
 
 +
Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)
 +
 
 +
===Проект===
 +
<span style="color:red"><big>'''Дедлайн 20 декабря 12.00'''</big></span> <br>
 +
[https://docs.google.com/document/d/1AVK9-22Ynci_hLsKuN6geOUr0tNgktdEDXvmmvURSeI/edit?usp=sharing Информаци об итоговом проекте]
 +
 
 +
[https://1drv.ms/f/s!Au_p7G0Px2PQlZM9lXfnPns8GXdnNg ПАПКА ДЛЯ ПРОЕКТОВ]
 +
 
 +
===Запись на экзамен===
 +
[https://docs.google.com/spreadsheets/d/1iN_-Q94UP_QLxakjCW4BAwh5U46CMUbowClofMTLMM8/edit#gid=0 Запись на экзамен]
 +
 
 +
===Материалы===
 +
[https://1drv.ms/u/s!Au_p7G0Px2PQg4p0B4E-1lVKhR7BLQ Тест]
 +
 
 +
===Опрос===
 +
[https://docs.google.com/forms/d/e/1FAIpQLSe24t7p36TkRZyIoimqZ8DVhaRW8b_92XBeWguHnH5Ufc0ECw/viewform Опрос]
 +
 
 +
===Порядок формирования оценок===
 +
* Оценка за курс накопительная, экзамен не проводится.
 +
* Предусмотрена защита проекта во время сессии.
 +
* Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
 +
* O<sub>результирующая</sub> = 0.6 * O<sub>дз</sub> + 0.4 * О<sub>проект</sub>
 +
 
 +
== Список рекомендуемых материалов ==
 +
 
 +
==== Линейная алгебра и статистика ====
 +
* [https://web.stanford.edu/~hastie/ElemStatLearn/ Hastie, Tibshirani, Friedman. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction.]
 +
* [http://people.math.umass.edu/~lavine/Book/book.pdf Lavine. (2013). Introduction to Statistical Thought]
 +
* [https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/ MIT Open course: Linear Algebra by Strang]
 +
 
 +
====Python====
 +
* [https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf Pandas Cheat Sheet]
 +
* [http://www.pyregex.com/ Python RegExp Cheat Sheet]
 +
* [http://opencarts.org/sachlaptrinh/pdf/28232.pdf O'Reilly: Python for Data Analysis]
 +
* [https://stepik.org/course/67/syllabus Базовый курс по программированию на Stepik]
 +
 
 +
==== Machine learning ====
 +
* [http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf Bishop. (2006). Pattern Recognition and Machine Learning]
 +
* [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 Курс по машинному обучению К.В. Воронцова]
 +
* [https://www.coursera.org/learn/machine-learning Coursera: Machine Learning by Andrew Ng]
 +
* [http://shop.oreilly.com/product/0636920018483.do O'Reilly: Machine Learning for Hackers]
 +
 
 +
==== Материала по ML ====
 +
* [https://www.kaggle.com/learn/machine-learning Simple Decision Tree]
 +
* [https://books.google.ru/books?id=vbQlDQAAQBAJ&dq=Introduction+to+Machine+Learning+with+Python:+A+Guide+for+Data+Scientists&hl=ru&source=gbs_navlinks_s Andreas C. Müller, Sarah Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists]
 +
 
 +
====Статистика====
 +
* Бослав С. Статистика для всех (Есть в библиотеке)
 +
* Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)
 +
 
 +
==== Web scraping ====
 +
* [http://shop.oreilly.com/product/0636920028468.do O'Reilly: RESTful Web APIs]

Текущая версия на 11:51, 24 июля 2019

О курсе

"Анализ данных в Python" читается на 4 курсе, в 1 и 2 модуле.

Организаторы

Лектор и семинарист: Рогович Татьяна Владимировна

Ассистент: Гергель Анастасия Игоревна

Материалы курса

Лекции

Дата лекции Тема Презентация
1 4 сентября 2018 г. Введение в анализ данных на языке Python. Почему Python становится стандартом для работы с большими данными. Прикладные задачи политологов, для решения которых подходит язык Python Лекция 1
2 6 сентября 2018 г. Основы линейной алгебры для анализа данных: векторы, матрицы и операции над ними см. материалы к семинару
3 20 сентября 2018 г. Введение в Pandas: Базовые принципы работы модуля Pandas Cheat Sheet
4 15 ноября 2018 г. Введение в Machine Learning. Решающие деревья. Лекция
5 22 ноября 2018 г. Анализ текстов Лекция

Семинары

Материалы к семинарам

Самостоятельные работы и домашнее задание

Тип Дедлайн Папка для ответов Результаты Комментарии
1 Домашнее задание №1 23.59 7.10.18 ДЗ 1 Результаты ДЗ 1
2 Домашнее задание №2 23.59 18.11.18 Ответы высылать на почту Результаты ДЗ 2 Фидбэк
3 Домашнее задание №3 23.59 12.12.18 Ответы высылать на почту

Ваши ответы размещайте с указанием Фамилии и Имя (Иванов.Иван.ipynb)

Проект

Дедлайн 20 декабря 12.00
Информаци об итоговом проекте

ПАПКА ДЛЯ ПРОЕКТОВ

Запись на экзамен

Запись на экзамен

Материалы

Тест

Опрос

Опрос

Порядок формирования оценок

  • Оценка за курс накопительная, экзамен не проводится.
  • Предусмотрена защита проекта во время сессии.
  • Штрафы за задержку сдачи заданий: опоздание в течение часа - штраф 0.5 балла, в течение суток - 1 балл, в течение недели - 2 балла. После недельной задержки домашнее задание не принимается. Уважительные причины рассматриваются в индивидуальном порядке.
  • Oрезультирующая = 0.6 * Oдз + 0.4 * Опроект

Список рекомендуемых материалов

Линейная алгебра и статистика

Python

Machine learning

Материала по ML

Статистика

  • Бослав С. Статистика для всех (Есть в библиотеке)
  • Gravetter F, Wallnau L. Statistics for behavioral sciences (Есть в библиотеке)

Web scraping