Анализ данных на python, фэн, 2020 fall
Содержание
- 1 О курсе
- 2 Правила выставления оценок
- 3 Распределение групп по семинаристам и ассистентам
- 4 Материалы курса
- 5 Оценивание
- 6 Большой план маленьких побед
- 6.1 Неделя 1. Вводимся в python, git и делаем import this
- 6.2 Неделя 2. Учимся работать с табличками в pandas
- 6.3 Неделя 3. Говорим про циклы и условия
- 6.4 Неделя 4. Говорим о функциях
- 6.5 Неделя 5. Говорим про словарики и множества
- 6.6 Неделя 11, 30 ноября. Логистическая регрессия: начало
- 6.7 Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета
- 7 Литература
О курсе
Преподаватели: Ананьева Марина Евгеньевна, Демешев Борис Борисович, Карпов Максим Евгеньевич, Максимовская Анастасия Максимовна, Петросян Артур Тигранович, Ульянкин Филипп Валерьевич, Филатов Артём Андреевич, Аброскин Илья Дмитриевич.
Правила выставления оценок
Распределение групп по семинаристам и ассистентам
Группа | Семинарист | Ассистент |
---|---|---|
191 | Борис Демешев @boris_demeshev | Никулина Женя @evgnikulina |
192 | Борис Демешев @boris_demeshev | Чирикова Настя @cOWOna_wivus |
193 | Филипп Ульянкин @Ppilif | Мазуров Матвей @Matmaz1 |
194 | Филипп Ульянкин @Ppilif | Романенко Саша @cutre_sa |
195 | Максим Карпов @buntar29 | Стрельцов Артём @in_chainz |
196 [online] | Артем Филатов @filatovartm | Кордзахия Натела @nkrdz |
197 | Артур Петросян @pet67 | Челбаев Михаил @mikhail_chelbaev |
198 [online] | Анастасия Максимовская @anastasiyamaxx | Алтунина Настя @anastasiia_altunina |
199 [online] | Анастасия Максимовская @anastasiyamaxx | Саурбек Ляззат @lyazzzzzzat |
1910 | Марина Ананьева @ananyevame | Карев Василий @Jack_karev |
1911 | Марина Ананьева @ananyevame | Андреевский Александр @alexandreevskiy |
1912 [online] | Илья Аброскин @iiiiilllllyyyyyaaaa | Огородников Михаил @Spectag |
1913 | Максим Карпов @buntar29 | Колесников Егор @kollego |
Материалы курса
- тг-чат курса и канал для объявлений
- github-репозиторий с материалами курса
- Youtube-канал с записями семинаров
- Материалы прошлого курса (весна 2020)
- Установите перед первым семинаром Anaconda. Инструкция для windows и инструкция для мака
Оценивание
Оценка ставится по формуле:
0.1 ДЗ1 + 0.1 ДЗ2 + 0.1 ДЗ3 + 0.1 ДЗ4 + 0.1 ДЗ5 + 0.075 СР1 + 0.075 СР2 + 0.075 СР3 + 0.075 СР4 + 0.1 КР + 0.1 ЭКЗ
Домашки:
- [HW1: таблички в pandas:](https://classroom.github.com/a/iAHUsz3_) предобрабатываем датасет и анализируем его. - [Контест, где надо представиться:](https://official.contest.yandex.ru/contest/20921/enter/) вбить группу и ссылку на репозиторий с дз1. - [HW2: циклы и услоия:](https://official.contest.yandex.ru/contest/20811/enter/) решаем просты задачки на циклы.
Контрольные:
- [Мини-КР 1](https://official.contest.yandex.ru/contest/20469/enter/)
Другое:
- [Прошлогодняя кр1 для разминки](https://official.contest.yandex.ru/contest/18100/problems/)
Большой план маленьких побед
Неделя 1. Вводимся в python, git и делаем import this
Необязательное дз:
- Альтернатива 1: попробовать освоить первые три урока из pythontutor и порешать задачки прямо в интерфейсе браузера.
- Альтернатива 2: пройти первые три недели курса на Coursera
Неделя 2. Учимся работать с табличками в pandas
Необязательное дз:
Неделя 3. Говорим про циклы и условия
Видео-материалы посмотреть:
- Неделя 2 и 5 курса на Coursera.
- Модули 1.10, 2.1, 2.2, 2.3 курса "Программирование на Python" на Stepik.
Дополнительные ссылки почитать:
- Объяснения и задачки на pythontutor по условиям и циклам for и while.
- Совсем краткий конспект на pythonworld по циклам и условиям.
Неделя 4. Говорим о функциях
- Неделя 4 и 6 курса на Coursera.
- Урок про функции и рекурсию на pythontutor
- Краткие конспекты про функции на pythonworld
Неделя 5. Говорим про словарики и множества
- Неделя 7 курса на Coursera.
- Уроки про множества и словари на pythontutor
- Краткие коспекты на pythonworld про словари и множества
- Если вы хотите немного углубиться в алгоритмическую составляющую, прочитайте книгу Грокаем Алгоритмы с примерами кода на python, она великолепная и очень просто написана с примерами на python
Неделя 11, 30 ноября. Логистическая регрессия: начало
- Стартовый ноутбук и данные к логистическим регрессиям.
- Из теории можно поботать из задачника: 3.13, 4.1, 4.5, 4.6, 4.7
Неделя 12, 7 декабря. Логистическая регрессия: вторая часть Марлезонского балета
Литература
Рекомендуемая основная литература:
- Christopher M. Bishop. (n.d.). Pattern Recognition and Machine Learning. Australian National University.
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media.
- Кремер Н. Ш. Теория вероятностей и математическая статистика 5-е изд., пер. и доп. Учебник и практикум для академического бакалавриата. Издательство Юрайт, 2019.
- Энатская Н. Ю., Хакимуллин Е. Р. Теория вероятностей и математическая статистика. Учебник и практикум для СПО. Издательство Юрайт, 2019.
- Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. Springer, 2009.
Рекомендуемая дополнительная литература:
- Vanderplas, J. T. Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). CA: Reilly - O’Reilly Media, 2016.
- Митчелл Р. Скрапинг веб-сайтов с помощю Python. Издательство "ДМК Пресс", 2016.