Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-17 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Добавлено практическое задание №1)
(Семинары)
 
(не показана одна промежуточная версия 3 участников)
Строка 20: Строка 20:
 
  |-
 
  |-
 
  | 26.01.2016 || Работа с таблицами и визуализация, Python Pandas и Matplotlib.<br />Проверочная по NumPy. Выдача первого домашнего задания ||
 
  | 26.01.2016 || Работа с таблицами и визуализация, Python Pandas и Matplotlib.<br />Проверочная по NumPy. Выдача первого домашнего задания ||
  |}
+
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/l5ug7dlxj416e4a/sem_3.ipynb notebook с занятия]
 +
  |-
 +
| 02.02.2016 || Метод градиентного спуска на примере регрессии ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/rypyazmvjucm02g/sem_4.ipynb notebook с занятия]
 +
|-
 +
| 09.02.2016 || Ликбез по статистике. Наивный байес ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/odkj4ijz8zi6b66/sem_05.ipynb notebook с занятия]
 +
|-
 +
| 01.03.2016 || Линейная регрессия: Ridge, Lasso ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/m64up6z5ifig8j7/sem_6.ipynb notebook с занятия]
 +
|-
 +
| 15.03.2016 || Линейная классификация: Logistic Regression, метрики качества ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/zyvctnd7cj411di/sem_07.ipynb notebook с занятия]
 +
|-
 +
| 19.04.2016 || Решающие деревья ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ssmbi9f3lkosral/decision_trees.ipynb notebook с занятия]
 +
|-
 +
| 26.04.2016 || Разбор первой части проекта ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/uh64e2mcu9dy924/project_s.ipynb notebook с занятия]
 +
|-
 +
| 10.05.2016 || Случайные леса. Метод главных компонент ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/7b4sdyvwx5o1keg/rf_pca.ipynb notebook1],
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ahk8sae6gb4y6yc/talgat_rf_pca.ipynb notebook2]
 +
|-
 +
| 17.05.2016 || Методы кластеризации, k-means. Метрики качества ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/c2suozftb8s5679/clustering.ipynb notebook]
 +
|-
 +
| 24.05.2016 || Решение задачик с [http://hackerrank.com hackerrank.com] ||
 +
[https://www.hackerrank.com/challenges/battery [1]],
 +
[https://www.hackerrank.com/challenges/stat-warmup [2]],
 +
[https://www.hackerrank.com/challenges/predicting-house-prices [3]],
 +
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],
 +
[https://www.hackerrank.com/challenges/document-classification [5](*)]
 +
|-
 +
| 31.05.2016 || Метрические методы классификации. KNN || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/70gqz2jvm0z1cl7/KNN.ipynb ноутбук]
 +
|-
 +
| 07.06.2016 || Ассоциативные правила. APriori || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qb9me3y2dnwunic/apriori.ipynb notebook с примером], [https://www.dropbox.com/s/zbtamhqgtvyxqbj/accidents.basket?dl=0 данные], [https://www.dropbox.com/s/n2w47t15m5dnfq1/features.csv?dl=0 описание признаков]
 +
|}
  
 
==Практические задания==
 
==Практические задания==
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/st833jferisczhs/HW1.ipynb Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"]
+
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/v6g0ld6y6vc5zmu/HW1_Username.ipynb Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"]
 +
 
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/dtx4hnnwjmcrgiu/HW2_Username.ipynb Практическое задание №2 "Методы линейной регрессии"]. '''Обновлено 1.3.2016'''
 +
 
 +
[https://www.dropbox.com/s/ua7wc2vpoi5mdbr/hse_project.pdf?dl=0 Проект. Начало.]
 +
 
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/tqhvg13spcwjtn1/HW4_Username.ipynb Практическое задание №3 "Решающие деревья"]
 +
 
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qudhpgdcaoljk61/project_2.ipynb Проект. Продолжение.]
 +
 
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ind6wpytgkossal/HW4_Username.ipynb Практическое задание №4 "Логистическая регрессия и предобработка данных"]. Срок сдачи: 4.6.2016
 +
 
 +
[https://www.dropbox.com/s/61qvambiq77ksnl/data.csv?dl=0 Данные для 4-го задания]
 +
 
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/xjadj6v91blbufj/HW5_Username.ipynb Практическое задание №5 "Метод главных компонент"]. Срок сдачи: 15.6.2016
 +
 
 +
[https://www.dropbox.com/s/oo3ev457tkg5jxe/data_task1.csv?dl=0 data_task1], [https://www.dropbox.com/s/ym5qsyrxwtyhma6/data_task2.csv?dl=0 data_task2]
  
 
== Оформление писем ==
 
== Оформление писем ==

Текущая версия на 21:39, 14 июня 2016

Общая информация

Семинаристы: Гитман Игорь, Захаров Егор

Занятия проходят по вторникам 3-ей парой в аудитории 4335

Почта курса: hse.minor.dm@gmail.com (просьба указывать тему в соответствии с шаблоном)

Оценки

Семинары

Дата Тема Материалы
12.01.2016 Вводное занятие
19.01.2016 Линейная алгебра, Python NumPy.
Проверочная по вводному занятию
notebook с занятия
26.01.2016 Работа с таблицами и визуализация, Python Pandas и Matplotlib.
Проверочная по NumPy. Выдача первого домашнего задания

notebook с занятия

02.02.2016 Метод градиентного спуска на примере регрессии

notebook с занятия

09.02.2016 Ликбез по статистике. Наивный байес

notebook с занятия

01.03.2016 Линейная регрессия: Ridge, Lasso

notebook с занятия

15.03.2016 Линейная классификация: Logistic Regression, метрики качества

notebook с занятия

19.04.2016 Решающие деревья

notebook с занятия

26.04.2016 Разбор первой части проекта

notebook с занятия

10.05.2016 Случайные леса. Метод главных компонент

notebook1, notebook2

17.05.2016 Методы кластеризации, k-means. Метрики качества

notebook

24.05.2016 Решение задачик с hackerrank.com

[1], [2], [3], [4], [5(*)]

31.05.2016 Метрические методы классификации. KNN ноутбук
07.06.2016 Ассоциативные правила. APriori notebook с примером, данные, описание признаков

Практические задания

Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"

Практическое задание №2 "Методы линейной регрессии". Обновлено 1.3.2016

Проект. Начало.

Практическое задание №3 "Решающие деревья"

Проект. Продолжение.

Практическое задание №4 "Логистическая регрессия и предобработка данных". Срок сдачи: 4.6.2016

Данные для 4-го задания

Практическое задание №5 "Метод главных компонент". Срок сдачи: 15.6.2016

data_task1, data_task2

Оформление писем

Просьба придерживаться данного стиля оформления темы письма, иначе оно не будет получено:

  • Вопросы: [ИАД-17] Вопрос
  • Сдача заданий: [ИАД-17] Задание N, ФИО

Сдача домашних заданий

  • Максимальная оценка за задание — 10 баллов + (при наличии) бонусные баллы
  • Для каждого домашнего задания будет установлен дедлайн. Штраф за день просрочки: 0.2 балла, датой сдачи считается дата отправки письма с заданием
  • Имена файлов, которые вы прикрепляете к письму, должны содержать вашу фамилию на латинице, например Ivanov.ipynb
  • Просьба отправлять на почту курса только итоговую версию задания

Обращаем внимание, что плагиат будет строго наказываться.

Задания вы можете выполнять как на виртуальной машине, так и на своём компьютере. При этом нами рекомендуется второй вариант, потому что неработоспособность виртуальной машины не будет являться уважительной причиной для просрочки дедлайна. Руководство по установке iPython и необходимых библиотек находится здесь. Для работы понадобится следующий базовый минимум установленных пакетов: Jupyter, iPython, NumPy, SciPy, Scikit-learn, Matplotlib.

Также если решение задания вам нужно предоставить в виде ipython notebook, то наличие файла на виртуальной машине не является фактом сдачи, вам обязательно нужно отправить письмо на почту курса.