Введение в Data Science — различия между версиями
(→Сроки сдачи) |
м (reference course added) |
||
(не показано 6 промежуточных версии ещё одного участника) | |||
Строка 3: | Строка 3: | ||
[https://www.hse.ru/edu/courses/214347690 Программа курса] | [https://www.hse.ru/edu/courses/214347690 Программа курса] | ||
+ | |||
+ | [https://www.edureka.co/data-science-python-certification-course Data Science with Python] | ||
== Критерии оценки == | == Критерии оценки == | ||
Строка 89: | Строка 91: | ||
|- | |- | ||
− | || 8 || Кластеризация || || | + | || 8 || Кластеризация || [https://www.dropbox.com/s/thiwdx1byk6827o/Семинар_3_Кластеризация.ipynb?dl=0 ipython notebook] || [https://www.dropbox.com/s/xxzsr2j6lqi4bkb/FoodConsumptionInEurope.csv?dl=0 датасет] |
|- | |- | ||
− | || 9 || Регрессия. Метрики качества || || | + | || 9 || Регрессия. Метрики качества ||[https://yadi.sk/d/1F9cQGgX3WykbQ ipython notebook] || [https://yadi.sk/i/cj2Z5ZKg3Wykgs датасет] |
|- | |- | ||
− | || 10 || Анализ текстов || || | + | || 10 || Анализ текстов ||[https://yadi.sk/d/rSe-BnHU3XrkF4 ipython notebook] || [https://yadi.sk/i/UBd3Bzog3Xrm33 датасет для семинара] [https://yadi.sk/d/bb-Q7JUn3Xrm7C датасет для самостоятельной работы] |
|} | |} | ||
Строка 137: | Строка 139: | ||
|БММ173 || aaivanov_5@edu.hse.ru || 11 мая 2018 г., 23.59 (UTC +3) || || || | |БММ173 || aaivanov_5@edu.hse.ru || 11 мая 2018 г., 23.59 (UTC +3) || || || | ||
|- | |- | ||
− | |БМБ171 || marat.akhmatnurov@yandex.ru zhorasukasyan@ya.ru || 2018-05-11 23:59|| || || | + | |БМБ171 || marat.akhmatnurov@yandex.ru zhorasukasyan@ya.ru || 2018-05-11 23:59|| 2018-06-13 23:59|| || 2018-06-16 23:59 |
|- | |- | ||
|БМБ172 || eromanova@hse.ru || 10.05.2018, 23.59 (UTC +3) || || || | |БМБ172 || eromanova@hse.ru || 10.05.2018, 23.59 (UTC +3) || || || |
Текущая версия на 10:30, 27 августа 2021
Содержание
О курсе
Курс для студентов 1 курса ФБиМ направлений "Маркетинг и рыночная аналитика" и "Управление бизнесом"
Критерии оценки
Оценка за курс = 0.4*Семинары + 0.4*ДЗ + 0.2*Экзамен
Округление осуществляется по арифметическим правилам.
Семинары
- На каждом семинаре выполняется небольшая самостоятельная работы по пройденной семе
- Дедлайн семинарской работы - до конца занятия, но по решению преподавателя может быть отложен.
- Система оценивания бинарная: 1 - если задание выполнено, 0 - если задание не сделано/сдано после дедлайна
- Предусмотрено 11 семинаров
- В конце семестра суммируется число выполненных заданий (max 11); сумма пропорционально переводится в 10-балльную шкалу
- Студенты имеют право сдать строго 1 задание, не присутствуя на семинаре, в течение курса.
Домашние задания
- В курсе предусмотрено 4 домашних задания
- Дедлайны устаналиваются каждой группе индивидуально преподавателем. О сроках сдачи сообщают не менее, чем за 2 недели до дедлайна.
Экзамен
Материалы курса
Лекции
№ | Тема | Презентация ! |
---|---|---|
1 | Введение | Презентация к лекции 1 |
2 | Обзор инструментов. Python | Презентация к лекции 2 |
3 | Обзорная лекция про математику | Презентация к лекции 3 |
4 | Этапы проекта. Рынок данных. Задачи Data Science | Презентация к лекции 4 |
5 | Еще про Python. Кейс | Поток 1: Презентция Поток 2: Презентация к лекции 5 |
Инструкция по установке и запуску среды
Скачать и установить анаконду:
1. Заходим по ссылке https://www.anaconda.com/download В центре надпись Download for, выбираем нужную ОС
2. Нажимаем на кнопку Download (Python 3.6 version) Дальше следуем инструкции https://docs.anaconda.com/anaconda/install/windows (для windows) https://docs.anaconda.com/anaconda/install/mac-os#macos-graphical-install (для macOS)
Домашнее задание и семнары вы будете выполнять в Jupyter'е. Чтобы его запустить, нужно открыть Ananconda Navigator и там под иконкой Jupyter Notebook (не путать с Jupyterlab) нажать на launch.
Семинары
Для работы в классе (при желании) на собственных ноутбуках и самостоятельного изучения рекомендуем установить Anaconda, Python версии 3.6 и выше.
Внутри каждого IPython-ноутбука есть семинарский материал и задача для самостоятельного выполнения. Датасеты доступны либо в правом столбце, либо в каждом из ноутбуков есть ссылка на скачивание нужного датасета.
№ | Тема | Ноутбук | Датасет |
---|---|---|---|
1 | Введение в язык | Скачать IPython Notebook | Нет |
2 | Введение в Pandas | Скачать IPython Notebook Версия для семинаров после 2018-04-17 |
Датасет для работы на семинаре |
3 | Описательная статистика в Python | Скачать IPython Notebook Скачать IPython Notebook для БММ171 и БМБ178 |
Датасет для самостоятельной работы |
4 | Визуализация данных | Скачать IPython Notebook | Датасет для работы в классе |
5 | A/B-тестирование | Скачать IPython Notebook (старая версия) Бутстрап-тестирование |
Датасет для работы в классе (старая версия) Датасет для бутстрапа |
6 - 7 | Классификация. Метрики качества | Скачать IPython Notebook Скачать IPython Notebook для групп БМБ 172 БМБ 175 |
|
8 | Кластеризация | ipython notebook | датасет |
9 | Регрессия. Метрики качества | ipython notebook | датасет |
10 | Анализ текстов | ipython notebook | датасет для семинара датасет для самостоятельной работы |
Рабочие ведомости
Маркетинг и рыночная аналитика
Управление бизнесом
БМБ 171
БМБ 172
БМБ 173
БМБ 174
БМБ 175
БМБ 176
БМБ 177
БМБ 178
Домашние задания
Требования к датасетам
- БМБ178, БММ171
не менее 1000 объектов (строк), не менее 5 признаков (5 колонок)
Источники данных
UCI Machine Learning Repository
ДЗ №3 - постановка задачи
Файл с заданием
Срок - 25.05.2018 для всех групп.
Сроки сдачи
Группа | Адрес отправки ДЗ | Дедлайн ДЗ1 | Дедлайн ДЗ2 | Дедлайн ДЗ3 | Дедлайн ДЗ4 |
---|---|---|---|---|---|
БММ171 | managementdataculture@gmail.com | 31.05.2018, 23.59 (UTC +3) Тема письма: БММ171. ДЗ1. Фамилия Задание |
16.06.2018, 23.59 (UTC +3) Тема письма: БММ171. ДЗ2. Фамилия Задание | Файл с заданием 25.05.2018 | 16.06.2018, 23.59 (UTC +3) Тема письма: БММ171. ДЗ4. Фамилия Задание |
БММ172 | @ppillif в телеграме | 14.05.2018 | |||
БММ173 | aaivanov_5@edu.hse.ru | 11 мая 2018 г., 23.59 (UTC +3) | |||
БМБ171 | marat.akhmatnurov@yandex.ru zhorasukasyan@ya.ru | 2018-05-11 23:59 | 2018-06-13 23:59 | 2018-06-16 23:59 | |
БМБ172 | eromanova@hse.ru | 10.05.2018, 23.59 (UTC +3) | |||
БМБ173 | |||||
БМБ174 | |||||
БМБ175 | eromanova@hse.ru | 10.05.2018, 23.59 (UTC +3) | |||
БМБ176 | |||||
БМБ177 | |||||
БМБ178 | managementdataculture@gmail.com | 31.05.2018, 23.59 (UTC +3) Тема письма: БМБ178. ДЗ1. Фамилия Задание |
16.06.2018, 23.59 (UTC +3) Тема письма: БМБ178. ДЗ2. Фамилия Задание | Файл с заданием 25.05.2018 | 16.06.2018, 23.59 (UTC +3) Тема письма: БМБ178. ДЗ4. Фамилия Задание |
Дополнительное
Материалы
(Изучите хотя бы первую часть Notebook Basics (знакомство с интефейсом))
Сборник из 100 упражнений для знакомства с библиотекой numpy: есть версии без ответов и подсказок, с подсказками, с эталонными ответами
Короткие уроки на платформе Kaggle, чтобы закрепить навыки работы с Pandas. Нужно зарегистрироваться, открыть урок, нажать кнопку "Fork" и писать код :)
Мероприятия
Data & Science: управление проектами, 14 апреля 2018, Москва — События Яндекса
Преподаватели
Лекции
- @unkinddragon
- alexander.belugin@outlook.com
- @alantonov
- alexantonov@gmail.com
Семинары
- @dmitryserg (Telegram)
- vk Дмитрий Сергеев
- @ppilif (Telegram)
- /ppilif (vk.com)
- @VasilyPanin (Telegram)
- elentevanyan@gmail.com
- Facebook Элен Теванян
- @elentevanyan (Telegram, если asap/мир вот-вот рухнет)
- marat.akhmatnurov@yandex.ru
- @maratakhmatnurov (Telegram, in case of emergency)