Анализ данных на python, фэн, 2020 spring — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «==О курсе== '''Преподаватели:''' Ананьева Марина Евгеньевна, [https://www.hse.ru/staff/bbd Демешев Борис…»)
 
(Содержимое страницы заменено на «ААААААА»)
Строка 1: Строка 1:
==О курсе==
+
ААААААА
 
+
'''Преподаватели:''' Ананьева Марина Евгеньевна, [https://www.hse.ru/staff/bbd Демешев Борис Борисович], [https://www.hse.ru/staff/mekarpov Карпов Максим Евгеньевич], Максимовская Анастасия Максимовна, [https://www.hse.ru/org/persons/65841825 Петросян Артур Тигранович], Ульянкин Филипп Валерьевич, Филатов Артём Андреевич, Аброскин Илья Дмитриевич.
+
 
+
== Правила выставления оценок ==
+
 
+
== Распределение групп по семинаристам и ассистентам ==
+
 
+
+
{| class="wikitable"
+
|-
+
! Группа !! Семинарист !! Ассистент
+
|-
+
| 191 || Борис Демешев @boris_demeshev || Никулина Женя @evgnikulina
+
|-
+
| 192 || Борис Демешев @boris_demeshev ||  Чирикова Настя @cOWOna_wivus
+
|-
+
| 193 || Филипп Ульянкин @Ppilif || Мазуров Матвей @Matmaz1
+
|-
+
| 194 || Филипп Ульянкин @Ppilif || Романенко Саша @cutre_sa
+
|-
+
| 195 || Максим Карпов @buntar29 || Стрельцов Артём @in_chainz
+
|-
+
| 196 [online] || Артем Филатов @filatovartm || Кордзахия Натела  @nkrdz
+
|-
+
| 197 || Артур Петросян @pet67 || Челбаев Михаил @mikhail_chelbaev
+
|-
+
| 198 [online] || Анастасия Максимовская @anastasiyamaxx || Алтунина Настя @anastasiia_altunina
+
|-
+
| 199 [online] || Анастасия Максимовская @anastasiyamaxx || Саурбек Ляззат  @lyazzzzzzat
+
|-
+
| 1910 || Марина Ананьева @ananyevame || Карев Василий  @Jack_karev
+
|-
+
| 1911 || Марина Ананьева @ananyevame || Андреевский Александр @alexandreevskiy
+
|-
+
| 1912 [online] || Илья Аброскин @iiiiilllllyyyyyaaaa || Огородников Михаил  @Spectag
+
|-
+
| 1913 || Максим Карпов @buntar29 || Колесников Егор @kollego
+
|}
+
 
+
==Материалы курса==
+
 
+
* [https://t.me/ds_econ_2020 тг-чат курса] и [https://t.me/joinchat/AAAAAExc2DC-31ME6dQhnQ канал для объявлений]
+
* github-репозиторий с [https://github.com/hse-econ-data-science/dap_2020_fall материалами курса]
+
* [https://www.youtube.com/playlist?list=PLEwK9wdS5g0oKVIXZtbU3evzL4ndN2aXk Youtube-канал] с записями семинаров
+
* [https://github.com/hse-econ-data-science/eds_spring_2020 Материалы прошлого курса (весна 2020)]
+
* Установите перед первым семинаром Anaconda. [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_windows.pdf Инструкция для windows] и [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_mac.pdf инструкция для мака]
+
 
+
==Оценивание==
+
 
+
 
+
Оценка ставится по формуле:
+
 
+
0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ
+
 
+
 
+
'''Домашки:'''
+
 
+
- [HW1: таблички в pandas:](https://classroom.github.com/a/iAHUsz3_) предобрабатываем датасет и анализируем его.
+
- [Контест, где надо представиться:](https://official.contest.yandex.ru/contest/20921/enter/)  вбить группу и ссылку на репозиторий с дз1.
+
- [HW2: циклы и услоия:](https://official.contest.yandex.ru/contest/20811/enter/) решаем просты задачки на циклы.
+
 
+
'''Контрольные:'''
+
 
+
- [Мини-КР 1](https://official.contest.yandex.ru/contest/20469/enter/)
+
 
+
 
+
'''Другое:'''
+
 
+
- [Прошлогодняя кр1 для разминки](https://official.contest.yandex.ru/contest/18100/problems/)
+
 
+
==Большой план маленьких побед==
+
 
+
==== Неделя 1. Вводимся в python, git и делаем import this ====
+
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem01 sem01]
+
 
+
Необязательное дз:
+
* Альтернатива 1: попробовать освоить первые [https://pythontutor.ru/lessons/inout_and_arithmetic_operations/ три урока из pythontutor] и порешать задачки прямо в интерфейсе браузера.
+
* Альтернатива 2: пройти первые три недели [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus курса на Coursera]
+
 
+
==== Неделя 2. Учимся работать с табличками в pandas ====
+
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem02_pandas sem02]
+
 
+
Необязательное дз:
+
* Проработать [https://habr.com/ru/company/ods/blog/322626/ статью про то как в pandas можно делать разные штуки]
+
 
+
==== Неделя 3. Говорим про циклы и условия ====
+
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem03_for sem03]
+
 
+
Видео-материалы посмотреть:
+
* Неделя 2 и 5 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
+
* Модули 1.10, 2.1, 2.2, 2.3 курса "Программирование на Python" на [https://stepik.org/course/67 Stepik].
+
 
+
Дополнительные ссылки почитать:
+
* Объяснения и задачки на pythontutor по [https://pythontutor.ru/lessons/ifelse/ условиям] и циклам [https://pythontutor.ru/lessons/for_loop/ for] и [https://pythontutor.ru/lessons/while/ while].
+
* Совсем краткий конспект на pythonworld по [https://pythonworld.ru/osnovy/cikly-for-i-while-operatory-break-i-continue-volshebnoe-slovo-else.html циклам] и [https://pythonworld.ru/osnovy/instrukciya-if-elif-else-proverka-istinnosti-trexmestnoe-vyrazhenie-ifelse.html условиям].
+
 
+
==== Неделя 4. Говорим о функциях ====
+
 
+
* Неделя 4 и 6 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
+
* Урок про функции и рекурсию на [http://pythontutor.ru/lessons/functions/ pythontutor]
+
* Краткие конспекты [https://pythonworld.ru/tipy-dannyx-v-python/vse-o-funkciyax-i-ix-argumentax.html про функции] на pythonworld
+
 
+
==== Неделя 5. Говорим про словарики и множества ====
+
 
+
* Неделя 7 курса на [https://www.coursera.org/learn/python-osnovy-programmirovaniya#syllabus Coursera].
+
* Уроки про [http://pythontutor.ru/lessons/sets/ множества] и [http://pythontutor.ru/lessons/dicts/ словари] на  pythontutor
+
* Краткие коспекты на pythonworld про [https://pythonworld.ru/tipy-dannyx-v-python/slovari-dict-funkcii-i-metody-slovarej.html словари] и [https://pythonworld.ru/tipy-dannyx-v-python/mnozhestva-set-i-frozenset.html множества]
+
* Если вы хотите немного углубиться в алгоритмическую составляющую, прочитайте книгу Грокаем Алгоритмы с примерами кода на python, она великолепная и очень просто написана с примерами на python
+
 
+
 
+
 
+
==== Неделя 11, 30 ноября. Логистическая регрессия: начало ====
+
 
+
* [https://github.com/hse-econ-data-science/dap_2020_fall/tree/master/sem12_13_logisticRegression Стартовый ноутбук] и данные к логистическим регрессиям.
+
* Из теории можно поботать [https://github.com/bdemeshev/mlearn_pro/raw/master/mlearn_pro.pdf из задачника]: 3.13, 4.1, 4.5, 4.6, 4.7
+
 
+
 
+
==== Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета ====
+
 
+
* [https://www.kaggle.com/janiobachmann/credit-fraud-dealing-with-imbalanced-datasets credit card example]
+
 
+
==Литература==
+
 
+
'''Рекомендуемая основная литература:'''
+
 
+
* Christopher M. Bishop. (n.d.). [http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705 Pattern Recognition and Machine Learning.] Australian National University.
+
* Lutz, M. (2008). [http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=415392 Learning Python (Vol. 3rd ed).] Beijing: O’Reilly Media.
+
* Кремер Н. Ш. [https://biblio-online.ru/book/teoriya-veroyatnostey-i-matematicheskaya-statistika-431167 Теория вероятностей и математическая статистика 5-е изд., пер. и доп. Учебник и практикум для академического бакалавриата.] Издательство Юрайт, 2019.
+
* Энатская Н. Ю., Хакимуллин Е. Р. [https://biblio-online.ru/book/teoriya-veroyatnostey-i-matematicheskaya-statistika-446435 Теория вероятностей и математическая статистика. Учебник и практикум для СПО.] Издательство Юрайт, 2019.
+
* Hastie, T., Tibshirani, R., Friedman, J. [https://link.springer.com/book/10.1007%2F978-0-387-84858-7 The elements of statistical learning: Data Mining, Inference, and Prediction.]  Springer, 2009.
+
 
+
'''Рекомендуемая дополнительная литература:'''
+
 
+
* Vanderplas, J. T. [http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1425081 Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition).] CA: Reilly - O’Reilly Media, 2016.
+
* Митчелл Р. [https://e.lanbook.com/book/100903 Скрапинг веб-сайтов с помощю Python.] Издательство "ДМК Пресс", 2016.
+

Версия 21:05, 13 января 2021

ААААААА