Анализ данных на python, фэн, 2020 fall — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Большой план маленьких побед)
 
(не показано 15 промежуточных версии 4 участников)
Строка 45: Строка 45:
 
* [https://www.youtube.com/playlist?list=PLEwK9wdS5g0oKVIXZtbU3evzL4ndN2aXk Youtube-канал] с записями семинаров
 
* [https://www.youtube.com/playlist?list=PLEwK9wdS5g0oKVIXZtbU3evzL4ndN2aXk Youtube-канал] с записями семинаров
 
* [https://github.com/hse-econ-data-science/eds_spring_2020 Материалы прошлого курса (весна 2020)]
 
* [https://github.com/hse-econ-data-science/eds_spring_2020 Материалы прошлого курса (весна 2020)]
* Установите перед первым семинаром Anaconda. [[(https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_windows.pdf|Инструкция для windows]] и [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_mac.pdf инструкция для мака]
+
* Установите перед первым семинаром Anaconda. [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_windows.pdf Инструкция для windows] и [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_mac.pdf инструкция для мака]
  
 
==Оценивание==
 
==Оценивание==
Строка 54: Строка 54:
 
0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ
 
0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ
  
 +
 +
'''Домашки:'''
 +
 +
- [HW1: таблички в pandas:](https://classroom.github.com/a/iAHUsz3_) предобрабатываем датасет и анализируем его.
 +
- [Контест, где надо представиться:](https://official.contest.yandex.ru/contest/20921/enter/)  вбить группу и ссылку на репозиторий с дз1.
 +
- [HW2: циклы и услоия:](https://official.contest.yandex.ru/contest/20811/enter/) решаем просты задачки на циклы.
 +
 +
'''Контрольные:'''
 +
 +
- [Мини-КР 1](https://official.contest.yandex.ru/contest/20469/enter/)
 +
 +
 +
'''Другое:'''
 +
 +
- [Прошлогодняя кр1 для разминки](https://official.contest.yandex.ru/contest/18100/problems/)
  
 
==Большой план маленьких побед==
 
==Большой план маленьких побед==
  
{| class="wikitable"
+
==== Неделя 1. Вводимся в python, git и делаем import this ====
|-
+
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem01 sem01]
! № недели
+
 
! Материалы семинаров (github)
+
Необязательное дз:
! Рекомендуемые онлайн-материалы к каждой неделе (не оценивается)
+
* Альтернатива 1: попробовать освоить первые [https://pythontutor.ru/lessons/inout_and_arithmetic_operations/ три урока из pythontutor] и порешать задачки прямо в интерфейсе браузера.  
|-
+
* Альтернатива 2: пройти первые три недели [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus курса на Coursera]
| style="text-align:center;" | 1
+
 
| Вводимся в python, git и делаем import this [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem01 sem01]
+
==== Неделя 2. Учимся работать с табличками в pandas ====
| * Альтернатива 1: попробовать освоить первые [https://pythontutor.ru/lessons/inout_and_arithmetic_operations/ три урока из pythontutor] и порешать задачки прямо в интерфейсе браузера. <br />* Альтернатива 2: пройти первые две недели [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus курса на Coursera]
+
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem02_pandas sem02]
|-
+
 
| style="text-align:center;" | 2
+
Необязательное дз:
| Учимся работать с табличками в pandas [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem02_pandas sem02]
+
* Проработать [https://habr.com/ru/company/ods/blog/322626/ статью про то как в pandas можно делать разные штуки]
|
+
 
|}
+
==== Неделя 3. Говорим про циклы и условия ====
 +
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem03_for sem03]
 +
 
 +
Видео-материалы посмотреть:
 +
* Неделя 2 и 5 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
 +
* Модули 1.10, 2.1, 2.2, 2.3 курса "Программирование на Python" на [https://stepik.org/course/67 Stepik].
 +
 
 +
Дополнительные ссылки почитать:
 +
* Объяснения и задачки на pythontutor по [https://pythontutor.ru/lessons/ifelse/ условиям] и циклам [https://pythontutor.ru/lessons/for_loop/ for] и [https://pythontutor.ru/lessons/while/ while].
 +
* Совсем краткий конспект на pythonworld по [https://pythonworld.ru/osnovy/cikly-for-i-while-operatory-break-i-continue-volshebnoe-slovo-else.html циклам] и [https://pythonworld.ru/osnovy/instrukciya-if-elif-else-proverka-istinnosti-trexmestnoe-vyrazhenie-ifelse.html условиям].
 +
 
 +
==== Неделя 4. Говорим о функциях ====
 +
 
 +
* Неделя 4 и 6 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
 +
* Урок про функции и рекурсию на [http://pythontutor.ru/lessons/functions/ pythontutor]
 +
* Краткие конспекты [https://pythonworld.ru/tipy-dannyx-v-python/vse-o-funkciyax-i-ix-argumentax.html про функции] на pythonworld
 +
 
 +
==== Неделя 5. Говорим про словарики и множества ====
 +
 
 +
* Неделя 7 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
 +
* Уроки про [http://pythontutor.ru/lessons/sets/ множества] и [http://pythontutor.ru/lessons/dicts/ словари] на  pythontutor
 +
* Краткие коспекты на pythonworld про [https://pythonworld.ru/tipy-dannyx-v-python/slovari-dict-funkcii-i-metody-slovarej.html словари] и [https://pythonworld.ru/tipy-dannyx-v-python/mnozhestva-set-i-frozenset.html множества]
 +
* Если вы хотите немного углубиться в алгоритмическую составляющую, прочитайте книгу Грокаем Алгоритмы с примерами кода на python, она великолепная и очень просто написана с примерами на python
 +
 
 +
 
 +
 
 +
==== Неделя 11, 30 ноября. Логистическая регрессия: начало ====
 +
 
 +
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem12_13_logisticRegression Стартовый ноутбук] и данные к логистическим регрессиям.
 +
* Из теории можно поботать [https://github.com/bdemeshev/mlearn_pro/raw/master/mlearn_pro.pdf из задачника]: 3.13, 4.1, 4.5, 4.6, 4.7
 +
 
 +
 
 +
==== Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета ====
 +
 
 +
* [https://www.kaggle.com/janiobachmann/credit-fraud-dealing-with-imbalanced-datasets credit card example]
  
 
==Литература==
 
==Литература==

Текущая версия на 00:06, 30 ноября 2020

О курсе

Преподаватели: Ананьева Марина Евгеньевна, Демешев Борис Борисович, Карпов Максим Евгеньевич, Максимовская Анастасия Максимовна, Петросян Артур Тигранович, Ульянкин Филипп Валерьевич, Филатов Артём Андреевич, Аброскин Илья Дмитриевич.

Правила выставления оценок

Распределение групп по семинаристам и ассистентам

Группа Семинарист Ассистент
191 Борис Демешев @boris_demeshev Никулина Женя @evgnikulina
192 Борис Демешев @boris_demeshev Чирикова Настя @cOWOna_wivus
193 Филипп Ульянкин @Ppilif Мазуров Матвей @Matmaz1
194 Филипп Ульянкин @Ppilif Романенко Саша @cutre_sa
195 Максим Карпов @buntar29 Стрельцов Артём @in_chainz
196 [online] Артем Филатов @filatovartm Кордзахия Натела @nkrdz
197 Артур Петросян @pet67 Челбаев Михаил @mikhail_chelbaev
198 [online] Анастасия Максимовская @anastasiyamaxx Алтунина Настя @anastasiia_altunina
199 [online] Анастасия Максимовская @anastasiyamaxx Саурбек Ляззат @lyazzzzzzat
1910 Марина Ананьева @ananyevame Карев Василий @Jack_karev
1911 Марина Ананьева @ananyevame Андреевский Александр @alexandreevskiy
1912 [online] Илья Аброскин @iiiiilllllyyyyyaaaa Огородников Михаил @Spectag
1913 Максим Карпов @buntar29 Колесников Егор @kollego

Материалы курса

Оценивание

Оценка ставится по формуле:

0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ


Домашки:

- [HW1: таблички в pandas:](https://classroom.github.com/a/iAHUsz3_) предобрабатываем датасет и анализируем его. - [Контест, где надо представиться:](https://official.contest.yandex.ru/contest/20921/enter/) вбить группу и ссылку на репозиторий с дз1. - [HW2: циклы и услоия:](https://official.contest.yandex.ru/contest/20811/enter/) решаем просты задачки на циклы.

Контрольные:

- [Мини-КР 1](https://official.contest.yandex.ru/contest/20469/enter/)


Другое:

- [Прошлогодняя кр1 для разминки](https://official.contest.yandex.ru/contest/18100/problems/)

Большой план маленьких побед

Неделя 1. Вводимся в python, git и делаем import this

Необязательное дз:

  • Альтернатива 1: попробовать освоить первые три урока из pythontutor и порешать задачки прямо в интерфейсе браузера.
  • Альтернатива 2: пройти первые три недели курса на Coursera

Неделя 2. Учимся работать с табличками в pandas

Необязательное дз:

Неделя 3. Говорим про циклы и условия

Видео-материалы посмотреть:

  • Неделя 2 и 5 курса на Coursera.
  • Модули 1.10, 2.1, 2.2, 2.3 курса "Программирование на Python" на Stepik.

Дополнительные ссылки почитать:

Неделя 4. Говорим о функциях

Неделя 5. Говорим про словарики и множества

  • Неделя 7 курса на Coursera.
  • Уроки про множества и словари на pythontutor
  • Краткие коспекты на pythonworld про словари и множества
  • Если вы хотите немного углубиться в алгоритмическую составляющую, прочитайте книгу Грокаем Алгоритмы с примерами кода на python, она великолепная и очень просто написана с примерами на python


Неделя 11, 30 ноября. Логистическая регрессия: начало


Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета

Литература

Рекомендуемая основная литература:

Рекомендуемая дополнительная литература: