Анализ данных на Python-Эконом-2022 — различия между версиями
м (small formatting improvement) |
(→Распределение групп по семинаристам и ассистентам) |
||
(не показаны 4 промежуточные версии ещё одного участника) | |||
Строка 11: | Строка 11: | ||
Вы получаете две оценки: одну — за курс, вторую — за независимый экзамен. | Вы получаете две оценки: одну — за курс, вторую — за независимый экзамен. | ||
− | Оценка за курс ставится по формуле: | + | Оценка за курс ставится по формуле: |
− | Min(10, 0.1*''МСР'' + 0.4*''БСР'' + 0.5*''ДЗ''), | + | <span style="background-color:#ddd;">Min(10, 0.1*''МСР'' + 0.4*''БСР'' + 0.5*''ДЗ'')</span>, |
где ''ДЗ'' — средняя оценка за все домашние задания (4 штуки), ''МСР'' — средняя оценка за все мини-самостоятельные работы на семинарах (около 6 штук), ''БСР'' — средняя оценка за все большие самостоятельные работы (3 штуки). Округление арифметическое. | где ''ДЗ'' — средняя оценка за все домашние задания (4 штуки), ''МСР'' — средняя оценка за все мини-самостоятельные работы на семинарах (около 6 штук), ''БСР'' — средняя оценка за все большие самостоятельные работы (3 штуки). Округление арифметическое. | ||
Строка 20: | Строка 20: | ||
==Идеология курса== | ==Идеология курса== | ||
− | Основная цель курса - научить вас скриптованию. По его итогам вы должны смело уметь открывать | + | Основная цель курса - научить вас скриптованию. По его итогам вы должны смело уметь открывать Python и писать гору кода для решения всех своих проблем. |
− | Курс представляет из себя сочетания онлайн и офлайн частей. В офлайн-части | + | Курс представляет из себя сочетания ''онлайн'' и ''офлайн'' частей. В офлайн-части мы ''на семинарах'' вместе что-то делаем: в основном, решаем задачи. В онлайн-части вы изучаете ''курс на Coursera'' и дополнительные материалы, которые мы выкладываем. |
− | Проверять то, как вы делаете онлайновую часть, мы не будем. Тем не менее, единственный способ научиться программировать - это много программировать. Если вы будете игнорировать онлайновую часть, довольно большой кусок практики выпадет из вашей жизни, а впоследствии на | + | Проверять то, как вы делаете онлайновую часть, мы не будем. Тем не менее, единственный способ научиться программировать - это много программировать. Если вы будете игнорировать онлайновую часть, довольно большой кусок практики выпадет из вашей жизни, а впоследствии на самостоятельных и экзамене возникнут проблемы. |
== Распределение групп по семинаристам и ассистентам == | == Распределение групп по семинаристам и ассистентам == | ||
Строка 38: | Строка 38: | ||
| 213 || || | | 213 || || | ||
|- | |- | ||
− | | 214 || Анастасия Максимовская ([https://t.me/anastasiyamaxx TG]) || | + | | 214 || Анастасия Максимовская ([https://t.me/anastasiyamaxx TG]) ||Савелий Прохоров ([https://t.me/Savely_Prokhorov TG]) |
|- | |- | ||
− | | 215 || Анастасия Максимовская ([https://t.me/anastasiyamaxx TG]) || | + | | 215 || Анастасия Максимовская ([https://t.me/anastasiyamaxx TG]) ||Савелий Прохоров ([https://t.me/Savely_Prokhorov TG]) |
|- | |- | ||
| 216 || || | | 216 || || | ||
Строка 55: | Строка 55: | ||
|- | |- | ||
| 2112 || || Нина Челышева ([https://t.me/ninachely TG]) | | 2112 || || Нина Челышева ([https://t.me/ninachely TG]) | ||
+ | |- | ||
+ | | 2113 || Матвей Зехов ([https://t.me/moonlight0071 TG]) || Натела Кордзахия ([https://t.me/nkrdz TG]) | ||
|} | |} | ||
Строка 73: | Строка 75: | ||
Установите перед первым семинаром Anaconda. [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_windows.pdf Инструкция для Windows] и [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_mac.pdfИнструкция для Mac] | Установите перед первым семинаром Anaconda. [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_windows.pdf Инструкция для Windows] и [https://github.com/hse-econ-data-science/dap_2020_fall/blob/master/utils/install_conda_mac.pdfИнструкция для Mac] | ||
− | Anaconda - это дистрибутив для новичка. Обычно рано или поздно от него отказываются. Если вы жёсткий и вам знакомо слово терминал, можно поставить | + | Anaconda - это дистрибутив для новичка. Обычно рано или поздно от него отказываются. Если вы жёсткий и вам знакомо слово терминал, можно поставить Python и всё необходимое через него. Желательно сразу же делать это [https://github.com/pyenv/pyenv через pyenv]. |
* '''[https://github.com/hse-econ-data-science/dap_2022-23/blob/main/sem01_intro sem01]''' Вводимся в Python, Git и делаем import this. | * '''[https://github.com/hse-econ-data-science/dap_2022-23/blob/main/sem01_intro sem01]''' Вводимся в Python, Git и делаем import this. |
Текущая версия на 15:48, 5 апреля 2022
Содержание
О курсе
Этой весной вас ждёт курс по Python. Следующей весной — курс по Анализу данных.
После каждого из этих курсов будет независимый экзамен от ФКН.
Преподаватели: Максимовская Анастасия Максимовна, Зарманбетов Ахмед Курманалиевич, Мидюкин Максим Олегович, Аброскин Илья Дмитриевич, Зехов Матвей Сергеевич, Ульянкин Филипп Валерьевич
Правила выставления оценок
Вы получаете две оценки: одну — за курс, вторую — за независимый экзамен.
Оценка за курс ставится по формуле:
Min(10, 0.1*МСР + 0.4*БСР + 0.5*ДЗ),
где ДЗ — средняя оценка за все домашние задания (4 штуки), МСР — средняя оценка за все мини-самостоятельные работы на семинарах (около 6 штук), БСР — средняя оценка за все большие самостоятельные работы (3 штуки). Округление арифметическое.
Независимый экзамен вы пишите в конце курса и получаете по его итогам отдельную оценку. Пробный вариант будет.
Идеология курса
Основная цель курса - научить вас скриптованию. По его итогам вы должны смело уметь открывать Python и писать гору кода для решения всех своих проблем.
Курс представляет из себя сочетания онлайн и офлайн частей. В офлайн-части мы на семинарах вместе что-то делаем: в основном, решаем задачи. В онлайн-части вы изучаете курс на Coursera и дополнительные материалы, которые мы выкладываем.
Проверять то, как вы делаете онлайновую часть, мы не будем. Тем не менее, единственный способ научиться программировать - это много программировать. Если вы будете игнорировать онлайновую часть, довольно большой кусок практики выпадет из вашей жизни, а впоследствии на самостоятельных и экзамене возникнут проблемы.
Распределение групп по семинаристам и ассистентам
Группа | Семинарист | Ассистент |
---|---|---|
211 | ||
212 | ||
213 | ||
214 | Анастасия Максимовская (TG) | Савелий Прохоров (TG) |
215 | Анастасия Максимовская (TG) | Савелий Прохоров (TG) |
216 | ||
217 | ||
218 | ||
219 | ||
2110 | ||
2111 | Евгения Никулина (TG) | |
2112 | Нина Челышева (TG) | |
2113 | Матвей Зехов (TG) | Натела Кордзахия (TG) |
Материалы курса
- TG-чат курса для поддержки и флуда и TG-канал для объявлений
- [ Таблица с оценками (будет позже)]
- GitHub-репозиторий
- Youtube-каналы с записями семинаров:
- Материалы прошлого курса (весна 2021) на GitHub
Домашки
Здесь появятся ссылки на контесты с задачами
Контрольные
Здесь появятся ссылки на контесты с задачами
Большой план (не)маленьких побед
Установите перед первым семинаром Anaconda. Инструкция для Windows и для Mac
Anaconda - это дистрибутив для новичка. Обычно рано или поздно от него отказываются. Если вы жёсткий и вам знакомо слово терминал, можно поставить Python и всё необходимое через него. Желательно сразу же делать это через pyenv.
- sem01 Вводимся в Python, Git и делаем import this.
- sem02 Говорим про циклы, условия, списки, что такое range (концепция генераторов на пальцах).
- sem03 Говорим про изменяемые и неизменяемые типы данных: списки, кортежи, строки и методы работы с ними. Обсуждаем как Python работает с памятью и где можно из-за этого накосячить.
- sem04 Говорим о функциях и рекурсии. Решаем задачи на циклы и оформляем их в виде функций.
- sem05 Говорим про словарики и множества
- sem06 Решаем задачи на словари и множества. Немного говорим про collections.
- sem07 Полезный функционал: list comprehension, map, lambda-функции, all, any, max, sorted, lambda внутри них как key и т.п. Мб про operator, collections и itertools
- sem08 Чтение и запись в файлы. Типы файлов: .txt, .json, .csv, .tsv, pickle. Введение в pandas: подгрузили табличку и сделали минимальное её шатание. Сразу забыли про pandas до следующего года. На экзамене им пользоваться нельзя.
- sem09 Учимся собирать данные, пишем парсеры.
- sem10 Работа с API
Литература
Рекомендуемая литература:
- Lutz, M. (2008). Learning Python (Vol. 3rd ed). Beijing: O’Reilly Media.
- Vanderplas, J. T. Python Data Science Handbook : Essential Tools for Working with Data (Vol. First edition). CA: Reilly - O’Reilly Media, 2016.
- Митчелл Р. Скрапинг веб-сайтов с помощю Python. Издательство "ДМК Пресс", 2016.