Анализ данных на python, фэн, 2020 fall — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показано 26 промежуточных версии 6 участников)
Строка 1: Строка 1:
 
==О курсе==
 
==О курсе==
  
'''Преподаватели:''' Ананьева Марина Евгеньевна, [https://www.hse.ru/staff/bbd Демешев Борис Борисович], Зарманбетов Ахмед Курманалиевич, Максимовская Анастасия Максимовна, [https://www.hse.ru/org/persons/65841825 Петросян Артур Тигранович], Ульянкин Филипп Валерьевич, Филатов Артём Андреевич.
+
'''Преподаватели:''' Ананьева Марина Евгеньевна, [https://www.hse.ru/staff/bbd Демешев Борис Борисович], [https://www.hse.ru/staff/mekarpov Карпов Максим Евгеньевич], Максимовская Анастасия Максимовна, [https://www.hse.ru/org/persons/65841825 Петросян Артур Тигранович], Ульянкин Филипп Валерьевич, Филатов Артём Андреевич, Аброскин Илья Дмитриевич.
  
 
== Правила выставления оценок ==
 
== Правила выставления оценок ==
Строка 41: Строка 41:
 
==Материалы курса==
 
==Материалы курса==
  
* [https://t.me/ds_econ_2020 тг-чат курса]
+
* [https://t.me/ds_econ_2020 тг-чат курса] и [https://t.me/joinchat/AAAAAExc2DC-31ME6dQhnQ канал для объявлений]
 
* github-репозиторий с [https://github.com/hse-econ-data-science/dap_2020_fall материалами курса]
 
* github-репозиторий с [https://github.com/hse-econ-data-science/dap_2020_fall материалами курса]
 +
* [https://www.youtube.com/playlist?list=PLEwK9wdS5g0oKVIXZtbU3evzL4ndN2aXk Youtube-канал] с записями семинаров
 +
* [https://github.com/hse-econ-data-science/eds_spring_2020 Материалы прошлого курса (весна 2020)]
 +
* Установите перед первым семинаром Anaconda. [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_windows.pdf Инструкция для windows] и [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_mac.pdf инструкция для мака]
  
==Рекомендуемые онлайн-материалы к каждой неделе (не оценивается)==
+
==Оценивание==
  
'''Неделя 1:'''
 
  
 +
Оценка ставится по формуле:
 +
 +
0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ
 +
 +
 +
'''Домашки:'''
 +
 +
- [HW1: таблички в pandas:](https://classroom.github.com/a/iAHUsz3_) предобрабатываем датасет и анализируем его.
 +
- [Контест, где надо представиться:](https://official.contest.yandex.ru/contest/20921/enter/)  вбить группу и ссылку на репозиторий с дз1.
 +
- [HW2: циклы и услоия:](https://official.contest.yandex.ru/contest/20811/enter/) решаем просты задачки на циклы.
 +
 +
'''Контрольные:'''
 +
 +
- [Мини-КР 1](https://official.contest.yandex.ru/contest/20469/enter/)
 +
 +
 +
'''Другое:'''
 +
 +
- [Прошлогодняя кр1 для разминки](https://official.contest.yandex.ru/contest/18100/problems/)
 +
 +
==Большой план маленьких побед==
 +
 +
==== Неделя 1. Вводимся в python, git и делаем import this ====
 +
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem01 sem01]
 +
 +
Необязательное дз:
 
* Альтернатива 1: попробовать освоить первые [https://pythontutor.ru/lessons/inout_and_arithmetic_operations/ три урока из pythontutor] и порешать задачки прямо в интерфейсе браузера.  
 
* Альтернатива 1: попробовать освоить первые [https://pythontutor.ru/lessons/inout_and_arithmetic_operations/ три урока из pythontutor] и порешать задачки прямо в интерфейсе браузера.  
* Альтернатива 2: пройти первые две недели [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus курса на Coursera]
+
* Альтернатива 2: пройти первые три недели [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus курса на Coursera]
 +
 
 +
==== Неделя 2. Учимся работать с табличками в pandas ====
 +
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem02_pandas sem02]
 +
 
 +
Необязательное дз:
 +
* Проработать [https://habr.com/ru/company/ods/blog/322626/ статью про то как в pandas можно делать разные штуки]
 +
 
 +
==== Неделя 3. Говорим про циклы и условия ====
 +
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem03_for sem03]
 +
 
 +
Видео-материалы посмотреть:
 +
* Неделя 2 и 5 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
 +
* Модули 1.10, 2.1, 2.2, 2.3 курса "Программирование на Python" на [https://stepik.org/course/67 Stepik].
 +
 
 +
Дополнительные ссылки почитать:
 +
* Объяснения и задачки на pythontutor по [https://pythontutor.ru/lessons/ifelse/ условиям] и циклам [https://pythontutor.ru/lessons/for_loop/ for] и [https://pythontutor.ru/lessons/while/ while].
 +
* Совсем краткий конспект на pythonworld по [https://pythonworld.ru/osnovy/cikly-for-i-while-operatory-break-i-continue-volshebnoe-slovo-else.html циклам] и [https://pythonworld.ru/osnovy/instrukciya-if-elif-else-proverka-istinnosti-trexmestnoe-vyrazhenie-ifelse.html условиям].
 +
 
 +
==== Неделя 4. Говорим о функциях ====
 +
 
 +
* Неделя 4 и 6 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
 +
* Урок про функции и рекурсию на [http://pythontutor.ru/lessons/functions/ pythontutor]
 +
* Краткие конспекты [https://pythonworld.ru/tipy-dannyx-v-python/vse-o-funkciyax-i-ix-argumentax.html про функции] на pythonworld
 +
 
 +
==== Неделя 5. Говорим про словарики и множества ====
 +
 
 +
* Неделя 7 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
 +
* Уроки про [http://pythontutor.ru/lessons/sets/ множества] и [http://pythontutor.ru/lessons/dicts/ словари] на  pythontutor
 +
* Краткие коспекты на pythonworld про [https://pythonworld.ru/tipy-dannyx-v-python/slovari-dict-funkcii-i-metody-slovarej.html словари] и [https://pythonworld.ru/tipy-dannyx-v-python/mnozhestva-set-i-frozenset.html множества]
 +
* Если вы хотите немного углубиться в алгоритмическую составляющую, прочитайте книгу Грокаем Алгоритмы с примерами кода на python, она великолепная и очень просто написана с примерами на python
 +
 
 +
 
 +
 
 +
==== Неделя 11, 30 ноября. Логистическая регрессия: начало ====
 +
 
 +
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem12_13_logisticRegression Стартовый ноутбук] и данные к логистическим регрессиям.
 +
* Из теории можно поботать [https://github.com/bdemeshev/mlearn_pro/raw/master/mlearn_pro.pdf из задачника]: 3.13, 4.1, 4.5, 4.6, 4.7
 +
 
 +
 
 +
==== Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета ====
 +
 
 +
* [https://www.kaggle.com/janiobachmann/credit-fraud-dealing-with-imbalanced-datasets credit card example]
  
 
==Литература==
 
==Литература==

Текущая версия на 00:06, 30 ноября 2020

О курсе

Преподаватели: Ананьева Марина Евгеньевна, Демешев Борис Борисович, Карпов Максим Евгеньевич, Максимовская Анастасия Максимовна, Петросян Артур Тигранович, Ульянкин Филипп Валерьевич, Филатов Артём Андреевич, Аброскин Илья Дмитриевич.

Правила выставления оценок

Распределение групп по семинаристам и ассистентам

Группа Семинарист Ассистент
191 Борис Демешев @boris_demeshev Никулина Женя @evgnikulina
192 Борис Демешев @boris_demeshev Чирикова Настя @cOWOna_wivus
193 Филипп Ульянкин @Ppilif Мазуров Матвей @Matmaz1
194 Филипп Ульянкин @Ppilif Романенко Саша @cutre_sa
195 Максим Карпов @buntar29 Стрельцов Артём @in_chainz
196 [online] Артем Филатов @filatovartm Кордзахия Натела @nkrdz
197 Артур Петросян @pet67 Челбаев Михаил @mikhail_chelbaev
198 [online] Анастасия Максимовская @anastasiyamaxx Алтунина Настя @anastasiia_altunina
199 [online] Анастасия Максимовская @anastasiyamaxx Саурбек Ляззат @lyazzzzzzat
1910 Марина Ананьева @ananyevame Карев Василий @Jack_karev
1911 Марина Ананьева @ananyevame Андреевский Александр @alexandreevskiy
1912 [online] Илья Аброскин @iiiiilllllyyyyyaaaa Огородников Михаил @Spectag
1913 Максим Карпов @buntar29 Колесников Егор @kollego

Материалы курса

Оценивание

Оценка ставится по формуле:

0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ


Домашки:

- [HW1: таблички в pandas:](https://classroom.github.com/a/iAHUsz3_) предобрабатываем датасет и анализируем его. - [Контест, где надо представиться:](https://official.contest.yandex.ru/contest/20921/enter/) вбить группу и ссылку на репозиторий с дз1. - [HW2: циклы и услоия:](https://official.contest.yandex.ru/contest/20811/enter/) решаем просты задачки на циклы.

Контрольные:

- [Мини-КР 1](https://official.contest.yandex.ru/contest/20469/enter/)


Другое:

- [Прошлогодняя кр1 для разминки](https://official.contest.yandex.ru/contest/18100/problems/)

Большой план маленьких побед

Неделя 1. Вводимся в python, git и делаем import this

Необязательное дз:

  • Альтернатива 1: попробовать освоить первые три урока из pythontutor и порешать задачки прямо в интерфейсе браузера.
  • Альтернатива 2: пройти первые три недели курса на Coursera

Неделя 2. Учимся работать с табличками в pandas

Необязательное дз:

Неделя 3. Говорим про циклы и условия

Видео-материалы посмотреть:

  • Неделя 2 и 5 курса на Coursera.
  • Модули 1.10, 2.1, 2.2, 2.3 курса "Программирование на Python" на Stepik.

Дополнительные ссылки почитать:

Неделя 4. Говорим о функциях

Неделя 5. Говорим про словарики и множества

  • Неделя 7 курса на Coursera.
  • Уроки про множества и словари на pythontutor
  • Краткие коспекты на pythonworld про словари и множества
  • Если вы хотите немного углубиться в алгоритмическую составляющую, прочитайте книгу Грокаем Алгоритмы с примерами кода на python, она великолепная и очень просто написана с примерами на python


Неделя 11, 30 ноября. Логистическая регрессия: начало


Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета

Литература

Рекомендуемая основная литература:

Рекомендуемая дополнительная литература: