Введение в Data Science — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Семинары)
(Семинары)
Строка 61: Строка 61:
 
|-
 
|-
 
|| 2 || Введение в Pandas || [https://drive.google.com/file/d/1C6T7LWMVaW6Vb2-Tv3NWZUUmz61A7XeT/view?usp=sharing Скачать IPython Notebook]<br /> [https://drive.google.com/open?id=1XaDxM3nxl4WwpcA4PMndOGAZVeWDThxe Версия для семинаров после 2018-04-17] || [https://drive.google.com/file/d/1Fe6BRqsp05V2bNhcUMXLJybC0XMQVbTL/view?usp=sharing Датасет для работы на семинаре]<br />
 
|| 2 || Введение в Pandas || [https://drive.google.com/file/d/1C6T7LWMVaW6Vb2-Tv3NWZUUmz61A7XeT/view?usp=sharing Скачать IPython Notebook]<br /> [https://drive.google.com/open?id=1XaDxM3nxl4WwpcA4PMndOGAZVeWDThxe Версия для семинаров после 2018-04-17] || [https://drive.google.com/file/d/1Fe6BRqsp05V2bNhcUMXLJybC0XMQVbTL/view?usp=sharing Датасет для работы на семинаре]<br />
[https://drive.google.com/file/d/16tb8VXhMcgaEDx_HGbhgGuHp5R8BQf6G/view?usp=sharing Датасет для самостоятельной работы]
+
[https://drive.google.com/file/d/16tb8VXhMcgaEDx_HGbhgGuHp5R8BQf6G/view?usp=sharing Датасет для самостоятельной работы]  
 
|-
 
|-
 
|| 3 ||  Описательная статистика в Python || [https://drive.google.com/file/d/1cVcOdks4A6wuLqOgcsOY9wGnILro_qVH/view?usp=sharing  Скачать IPython Notebook] <br />
 
|| 3 ||  Описательная статистика в Python || [https://drive.google.com/file/d/1cVcOdks4A6wuLqOgcsOY9wGnILro_qVH/view?usp=sharing  Скачать IPython Notebook] <br />
 
[https://drive.google.com/file/d/1tgtiW6bml_STJGz5C2gZ2hERnLasruOF/view?usp=sharing Скачать IPython Notebook для БММ171 и БМБ178] ||  
 
[https://drive.google.com/file/d/1tgtiW6bml_STJGz5C2gZ2hERnLasruOF/view?usp=sharing Скачать IPython Notebook для БММ171 и БМБ178] ||  
[https://drive.google.com/file/d/1sh0_GVMSPUR3IhtmXpXoBU4cEeRPU4y8/view?usp=sharing Датасет для самостоятельной работы]
+
[https://drive.google.com/file/d/1sh0_GVMSPUR3IhtmXpXoBU4cEeRPU4y8/view?usp=sharing Датасет для самостоятельной работы] || [https://drive.google.com/file/d/1rjhFCTLrT9m-rjc3VMyH5bP01RnC8nJS/view?usp=sharing Датасет для работы на семинаре БММ171 и БМБ178]
 
|-
 
|-
 
|| 4 || Визуализация данных || [https://drive.google.com/file/d/1N08QRk42L6pXjS620gQaEUFcP2kJVHCW/view?usp=sharing Скачать IPython Notebook]|| [https://drive.google.com/file/d/1rjhFCTLrT9m-rjc3VMyH5bP01RnC8nJS/view?usp=sharing Датасет для работы в классе]
 
|| 4 || Визуализация данных || [https://drive.google.com/file/d/1N08QRk42L6pXjS620gQaEUFcP2kJVHCW/view?usp=sharing Скачать IPython Notebook]|| [https://drive.google.com/file/d/1rjhFCTLrT9m-rjc3VMyH5bP01RnC8nJS/view?usp=sharing Датасет для работы в классе]

Версия 23:57, 27 апреля 2018

О курсе

Курс для студентов 1 курса ФБиМ направлений "Маркетинг и рыночная аналитика" и "Управление бизнесом"

Программа курса

Критерии оценки

Оценка за курс = 0.4*Семинары + 0.4*ДЗ + 0.2*Экзамен
Округление осуществляется по арифметическим правилам.

Семинары

  • На каждом семинаре выполняется небольшая самостоятельная работы по пройденной семе
  • Дедлайн семинарской работы - до конца занятия, но по решению преподавателя может быть отложен.
  • Система оценивания бинарная: 1 - если задание выполнено, 0 - если задание не сделано/сдано после дедлайна
  • Предусмотрено 11 семинаров
  • В конце семестра суммируется число выполненных заданий (max 11); сумма пропорционально переводится в 10-балльную шкалу
  • Студенты имеют право сдать строго 1 задание, не присутствуя на семинаре, в течение курса.

Домашние задания

  • В курсе предусмотрено 4 домашних задания
  • Дедлайны устаналиваются каждой группе индивидуально преподавателем. О сроках сдачи сообщают не менее, чем за 2 недели до дедлайна.

Экзамен

Материалы курса

Лекции

Тема Презентация !
1 Введение Презентация к лекции 1
2 Обзор инструментов. Python Презентация к лекции 2
3 Обзорная лекция про математику Презентация к лекции 3

Инструкция по установке и запуску среды

Скачать и установить анаконду:

1. Заходим по ссылке https://www.anaconda.com/download В центре надпись Download for, выбираем нужную ОС

2. Нажимаем на кнопку Download (Python 3.6 version) Дальше следуем инструкции https://docs.anaconda.com/anaconda/install/windows (для windows) https://docs.anaconda.com/anaconda/install/mac-os#macos-graphical-install (для macOS)

Домашнее задание и семнары вы будете выполнять в Jupyter'е. Чтобы его запустить, нужно открыть Ananconda Navigator и там под иконкой Jupyter Notebook (не путать с Jupyterlab) нажать на launch.


Семинары

Для работы в классе (при желании) на собственных ноутбуках и самостоятельного изучения рекомендуем установить Anaconda, Python версии 3.6 и выше.

Тема Ноутбук Датасет
1 Введение в язык Скачать IPython Notebook Нет
2 Введение в Pandas Скачать IPython Notebook
Версия для семинаров после 2018-04-17
Датасет для работы на семинаре

Датасет для самостоятельной работы

3 Описательная статистика в Python Скачать IPython Notebook

Скачать IPython Notebook для БММ171 и БМБ178 || Датасет для самостоятельной работы || Датасет для работы на семинаре БММ171 и БМБ178

4 Визуализация данных Скачать IPython Notebook Датасет для работы в классе
5 A/B-тестирование Скачать IPython Notebook Датасет для работы в классе

Датасет для самостоятельной работы

6 - 7 Классификация. Метрики качества Скачать IPython Notebook

Датасет для работы

8 Кластеризация
9 Регрессия. Метрики качества
10 Анализ текстов

Рабочие ведомости

Маркетинг и рыночная аналитика

БММ 171
БММ 172
БММ 173

Управление бизнесом

БМБ 171
БМБ 172
БМБ 173
БМБ 174
БМБ 175
БМБ 176
БМБ 177
БМБ 178

Домашние задания

Требования к датасетам

  • БМБ178, БММ171

не менее 1000 объектов (строк), не менее 5 признаков (5 колонок)

Источники данных

Kaggle Datasets

UCI Machine Learning Repository

Сроки сдачи

Группа Адрес отправки ДЗ Дедлайн ДЗ1 Дедлайн ДЗ2 Дедлайн ДЗ3 Дедлайн ДЗ4
БММ171 managementdataculture@gmail.com 13.05.2018, 23.59 (UTC +3) 20.05.2018, 23.59 (UTC +3)
БММ172
БММ173
БМБ171
БМБ172
БМБ173
БМБ174
БМБ175
БМБ176
БМБ177
БМБ178 managementdataculture@gmail.com 13.05.2018, 23.59 (UTC +3) 20.05.2018, 23.59 (UTC +3)

Дополнительное

Материалы

(Изучите хотя бы первую часть Notebook Basics (знакомство с интефейсом))

Сборник из 100 упражнений для знакомства с библиотекой numpy: есть версии без ответов и подсказок, с подсказками, с эталонными ответами

Короткие уроки на платформе Kaggle, чтобы закрепить навыки работы с Pandas. Нужно зарегистрироваться, открыть урок, нажать кнопку "Fork" и писать код :)

Мероприятия

Data & Science: управление проектами, 14 апреля 2018, Москва — События Яндекса

Преподаватели

Лекции

Александр Белугин

Александр Антонов

Семинары

Дмитрий Сергеев

Ульянкин Филипп

  • @ppilif (Telegram)
  • /ppilif (vk.com)

Василий Панин

  • @VasilyPanin (Telegram)

Валерий Бабушкин

Елена Романова

Ольга Дайховская

Элен Теванян


Марат Ахматнуров

  • marat.akhmatnurov@yandex.ru
  • @maratakhmatnurov (Telegram, in case of emergency)