Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-17 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Семинары)
Строка 52: Строка 52:
 
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],  
 
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],  
 
[https://www.hackerrank.com/challenges/document-classification [5](*)]
 
[https://www.hackerrank.com/challenges/document-classification [5](*)]
 +
|-
 +
| 31.05.2016 || Метрические методы классификации. KNN || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/70gqz2jvm0z1cl7/KNN.ipynb ноутбук]
 
|-
 
|-
 
  | 07.06.2016 || Ассоциативные правила. APriori || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qb9me3y2dnwunic/apriori.ipynb notebook с примером], [https://www.dropbox.com/s/zbtamhqgtvyxqbj/accidents.basket?dl=0 данные], [https://www.dropbox.com/s/n2w47t15m5dnfq1/features.csv?dl=0 описание признаков]
 
  | 07.06.2016 || Ассоциативные правила. APriori || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qb9me3y2dnwunic/apriori.ipynb notebook с примером], [https://www.dropbox.com/s/zbtamhqgtvyxqbj/accidents.basket?dl=0 данные], [https://www.dropbox.com/s/n2w47t15m5dnfq1/features.csv?dl=0 описание признаков]

Версия 11:33, 7 июня 2016

Общая информация

Семинаристы: Гитман Игорь, Захаров Егор

Занятия проходят по вторникам 3-ей парой в аудитории 4335

Почта курса: hse.minor.dm@gmail.com (просьба указывать тему в соответствии с шаблоном)

Оценки

Семинары

Дата Тема Материалы
12.01.2016 Вводное занятие
19.01.2016 Линейная алгебра, Python NumPy.
Проверочная по вводному занятию
notebook с занятия
26.01.2016 Работа с таблицами и визуализация, Python Pandas и Matplotlib.
Проверочная по NumPy. Выдача первого домашнего задания

notebook с занятия

02.02.2016 Метод градиентного спуска на примере регрессии

notebook с занятия

09.02.2016 Ликбез по статистике. Наивный байес

notebook с занятия

01.03.2016 Линейная регрессия: Ridge, Lasso

notebook с занятия

15.03.2016 Линейная классификация: Logistic Regression, метрики качества

notebook с занятия

19.04.2016 Решающие деревья

notebook с занятия

26.04.2016 Разбор первой части проекта

notebook с занятия

10.05.2016 Случайные леса. Метод главных компонент

notebook1, notebook2

17.05.2016 Методы кластеризации, k-means. Метрики качества
24.05.2016 Решение задачик с hackerrank.com

[1], [2], [3], [4], [5(*)]

31.05.2016 Метрические методы классификации. KNN ноутбук
07.06.2016 Ассоциативные правила. APriori notebook с примером, данные, описание признаков

Практические задания

Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"

Практическое задание №2 "Методы линейной регрессии". Обновлено 1.3.2016

Проект. Начало.

Практическое задание №3 "Решающие деревья"

Проект. Продолжение.

Практическое задание №4 "Логистическая регрессия и предобработка данных". Срок сдачи: 4.6.2016

Данные для 4-го задания

Практическое задание №5 "Метод главных компонент". Срок сдачи: 15.6.2016

data_task1, data_task2

Оформление писем

Просьба придерживаться данного стиля оформления темы письма, иначе оно не будет получено:

  • Вопросы: [ИАД-17] Вопрос
  • Сдача заданий: [ИАД-17] Задание N, ФИО

Сдача домашних заданий

  • Максимальная оценка за задание — 10 баллов + (при наличии) бонусные баллы
  • Для каждого домашнего задания будет установлен дедлайн. Штраф за день просрочки: 0.2 балла, датой сдачи считается дата отправки письма с заданием
  • Имена файлов, которые вы прикрепляете к письму, должны содержать вашу фамилию на латинице, например Ivanov.ipynb
  • Просьба отправлять на почту курса только итоговую версию задания

Обращаем внимание, что плагиат будет строго наказываться.

Задания вы можете выполнять как на виртуальной машине, так и на своём компьютере. При этом нами рекомендуется второй вариант, потому что неработоспособность виртуальной машины не будет являться уважительной причиной для просрочки дедлайна. Руководство по установке iPython и необходимых библиотек находится здесь. Для работы понадобится следующий базовый минимум установленных пакетов: Jupyter, iPython, NumPy, SciPy, Scikit-learn, Matplotlib.

Также если решение задания вам нужно предоставить в виде ipython notebook, то наличие файла на виртуальной машине не является фактом сдачи, вам обязательно нужно отправить письмо на почту курса.