Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-17 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Практические задания)
(Семинары)
Строка 44: Строка 44:
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ahk8sae6gb4y6yc/talgat_rf_pca.ipynb notebook2]
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ahk8sae6gb4y6yc/talgat_rf_pca.ipynb notebook2]
 
|-
 
|-
  | 17.05.2016 || ... || ...
+
  | 17.05.2016 || Методы кластеризации, k-means. Метрики качества ||
 
|-
 
|-
 
  | 24.05.2016 || Решение задачик с [http://hackerrank.com hackerrank.com] ||  
 
  | 24.05.2016 || Решение задачик с [http://hackerrank.com hackerrank.com] ||  
Строка 52: Строка 52:
 
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],  
 
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],  
 
[https://www.hackerrank.com/challenges/document-classification [5](*)]
 
[https://www.hackerrank.com/challenges/document-classification [5](*)]
  |}
+
|-
 +
  | 07.06.2016 || Ассоциативные правила. APriori || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qb9me3y2dnwunic/apriori.ipynb notebook с примером], [https://www.dropbox.com/s/zbtamhqgtvyxqbj/accidents.basket?dl=0 данные], [https://www.dropbox.com/s/n2w47t15m5dnfq1/features.csv?dl=0 описание признаков]
 +
|}
  
 
==Практические задания==
 
==Практические задания==

Версия 11:16, 7 июня 2016

Общая информация

Семинаристы: Гитман Игорь, Захаров Егор

Занятия проходят по вторникам 3-ей парой в аудитории 4335

Почта курса: hse.minor.dm@gmail.com (просьба указывать тему в соответствии с шаблоном)

Оценки

Семинары

Дата Тема Материалы
12.01.2016 Вводное занятие
19.01.2016 Линейная алгебра, Python NumPy.
Проверочная по вводному занятию
notebook с занятия
26.01.2016 Работа с таблицами и визуализация, Python Pandas и Matplotlib.
Проверочная по NumPy. Выдача первого домашнего задания

notebook с занятия

02.02.2016 Метод градиентного спуска на примере регрессии

notebook с занятия

09.02.2016 Ликбез по статистике. Наивный байес

notebook с занятия

01.03.2016 Линейная регрессия: Ridge, Lasso

notebook с занятия

15.03.2016 Линейная классификация: Logistic Regression, метрики качества

notebook с занятия

19.04.2016 Решающие деревья

notebook с занятия

26.04.2016 Разбор первой части проекта

notebook с занятия

10.05.2016 Случайные леса. Метод главных компонент

notebook1, notebook2

17.05.2016 Методы кластеризации, k-means. Метрики качества
24.05.2016 Решение задачик с hackerrank.com

[1], [2], [3], [4], [5(*)]

07.06.2016 Ассоциативные правила. APriori notebook с примером, данные, описание признаков

Практические задания

Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"

Практическое задание №2 "Методы линейной регрессии". Обновлено 1.3.2016

Проект. Начало.

Практическое задание №3 "Решающие деревья"

Проект. Продолжение.

Практическое задание №4 "Логистическая регрессия и предобработка данных"

Данные для 4-го задания

Оформление писем

Просьба придерживаться данного стиля оформления темы письма, иначе оно не будет получено:

  • Вопросы: [ИАД-17] Вопрос
  • Сдача заданий: [ИАД-17] Задание N, ФИО

Сдача домашних заданий

  • Максимальная оценка за задание — 10 баллов + (при наличии) бонусные баллы
  • Для каждого домашнего задания будет установлен дедлайн. Штраф за день просрочки: 0.2 балла, датой сдачи считается дата отправки письма с заданием
  • Имена файлов, которые вы прикрепляете к письму, должны содержать вашу фамилию на латинице, например Ivanov.ipynb
  • Просьба отправлять на почту курса только итоговую версию задания

Обращаем внимание, что плагиат будет строго наказываться.

Задания вы можете выполнять как на виртуальной машине, так и на своём компьютере. При этом нами рекомендуется второй вариант, потому что неработоспособность виртуальной машины не будет являться уважительной причиной для просрочки дедлайна. Руководство по установке iPython и необходимых библиотек находится здесь. Для работы понадобится следующий базовый минимум установленных пакетов: Jupyter, iPython, NumPy, SciPy, Scikit-learn, Matplotlib.

Также если решение задания вам нужно предоставить в виде ipython notebook, то наличие файла на виртуальной машине не является фактом сдачи, вам обязательно нужно отправить письмо на почту курса.