Анализ данных на Python-Эконом-2022
Содержание
О курсе
Этой весной вас ждёт курс по Python. Следующей весной — курс по Анализу данных.
После каждого из этих курсов будет независимый экзамен от ФКН.
Преподаватели: Максимовская Анастасия Максимовна, Зарманбетов Ахмед Курманалиевич, Мидюкин Максим Олегович, Аброскин Илья Дмитриевич, Зехов Матвей Сергеевич, Ульянкин Филипп Валерьевич
Правила выставления оценок
Вы получаете две оценки: одну — за курс, вторую — за независимый экзамен.
Оценка за курс ставится по формуле:
Min(10, 0.1*МСР + 0.4*БСР + 0.5*ДЗ),
где ДЗ — средняя оценка за все домашние задания (4 штуки), МСР — средняя оценка за все мини-самостоятельные работы на семинарах (около 6 штук), БСР — средняя оценка за все большие самостоятельные работы (3 штуки). Округление арифметическое.
Независимый экзамен вы пишите в конце курса и получаете по его итогам отдельную оценку. Пробный вариант будет.
Идеология курса
Основная цель курса - научить вас скриптованию. По его итогам вы должны смело уметь открывать Python и писать гору кода для решения всех своих проблем.
Курс представляет из себя сочетания онлайн и офлайн частей. В офлайн-части мы на семинарах вместе что-то делаем: в основном, решаем задачи. В онлайн-части вы изучаете курс на Coursera и дополнительные материалы, которые мы выкладываем.
Проверять то, как вы делаете онлайновую часть, мы не будем. Тем не менее, единственный способ научиться программировать - это много программировать. Если вы будете игнорировать онлайновую часть, довольно большой кусок практики выпадет из вашей жизни, а впоследствии на самостоятельных и экзамене возникнут проблемы.
Распределение групп по семинаристам и ассистентам
Группа | Семинарист | Ассистент |
---|---|---|
211 | ||
212 | ||
213 | ||
214 | Анастасия Максимовская (TG) | Савелий Прохоров (TG) |
215 | Анастасия Максимовская (TG) | Савелий Прохоров (TG) |
216 | ||
217 | ||
218 | ||
219 | ||
2110 | ||
2111 | Евгения Никулина (TG) | |
2112 | Нина Челышева (TG) | |
2113 | Матвей Зехов (TG) | Натела Кордзахия (TG) |
Материалы курса
- TG-чат курса для поддержки и флуда и TG-канал для объявлений
- [ Таблица с оценками (будет позже)]
- GitHub-репозиторий
- Youtube-каналы с записями семинаров:
- Материалы прошлого курса (весна 2021) на GitHub
Домашки
Здесь появятся ссылки на контесты с задачами
Контрольные
Здесь появятся ссылки на контесты с задачами
Большой план (не)маленьких побед
Установите перед первым семинаром Anaconda. Инструкция для Windows и для Mac
Anaconda - это дистрибутив для новичка. Обычно рано или поздно от него отказываются. Если вы жёсткий и вам знакомо слово терминал, можно поставить Python и всё необходимое через него. Желательно сразу же делать это через pyenv.
- sem01 Вводимся в Python, Git и делаем import this.
- sem02 Говорим про циклы, условия, списки, что такое range (концепция генераторов на пальцах).
- sem03 Говорим про изменяемые и неизменяемые типы данных: списки, кортежи, строки и методы работы с ними. Обсуждаем как Python работает с памятью и где можно из-за этого накосячить.
- sem04 Говорим о функциях и рекурсии. Решаем задачи на циклы и оформляем их в виде функций.
- sem05 Говорим про словарики и множества
- sem06 Решаем задачи на словари и множества. Немного говорим про collections.
- sem07 Полезный функционал: list comprehension, map, lambda-функции, all, any, max, sorted, lambda внутри них как key и т.п. Мб про operator, collections и itertools
- sem08 Чтение и запись в файлы. Типы файлов: .txt, .json, .csv, .tsv, pickle. Введение в pandas: подгрузили табличку и сделали минимальное её шатание. Сразу забыли про pandas до следующего года. На экзамене им пользоваться нельзя.
- sem09 Учимся собирать данные, пишем парсеры.
- sem10 Работа с API
Литература
Рекомендуемая литература:
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media.
- Vanderplas, J. T. Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). CA: Reilly - O’Reilly Media, 2016.
- Митчелл Р. Скрапинг веб-сайтов с помощю Python. Издательство "ДМК Пресс", 2016.