Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-17 — различия между версиями
м (→Семинары) |
(→Семинары) |
||
(не показано 40 промежуточных версии 3 участников) | |||
Строка 1: | Строка 1: | ||
== Общая информация == | == Общая информация == | ||
− | Семинаристы: Гитман Игорь, Захаров Егор | + | Семинаристы: Гитман Игорь, Захаров Егор |
Занятия проходят по вторникам 3-ей парой в аудитории 4335 | Занятия проходят по вторникам 3-ей парой в аудитории 4335 | ||
Строка 17: | Строка 17: | ||
| 12.01.2016 || Вводное занятие || | | 12.01.2016 || Вводное занятие || | ||
|- | |- | ||
− | | 19.01.2016 || Линейная алгебра, Python NumPy. Проверочная по вводному занятию || [https://shad.people.yandex.net/notebooks/17/numpy%20tutorial.ipynb notebook с занятия] | + | | 19.01.2016 || Линейная алгебра, Python NumPy.<br />Проверочная по вводному занятию || [https://shad.people.yandex.net/notebooks/17/numpy%20tutorial.ipynb notebook с занятия] |
|- | |- | ||
− | | 26.01.2016 || Работа с таблицами и визуализация, Python Pandas и Matplotlib. Проверочная по NumPy. Выдача первого домашнего задания || | + | | 26.01.2016 || Работа с таблицами и визуализация, Python Pandas и Matplotlib.<br />Проверочная по NumPy. Выдача первого домашнего задания || |
− | |} | + | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/l5ug7dlxj416e4a/sem_3.ipynb notebook с занятия] |
+ | |- | ||
+ | | 02.02.2016 || Метод градиентного спуска на примере регрессии || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/rypyazmvjucm02g/sem_4.ipynb notebook с занятия] | ||
+ | |- | ||
+ | | 09.02.2016 || Ликбез по статистике. Наивный байес || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/odkj4ijz8zi6b66/sem_05.ipynb notebook с занятия] | ||
+ | |- | ||
+ | | 01.03.2016 || Линейная регрессия: Ridge, Lasso || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/m64up6z5ifig8j7/sem_6.ipynb notebook с занятия] | ||
+ | |- | ||
+ | | 15.03.2016 || Линейная классификация: Logistic Regression, метрики качества || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/zyvctnd7cj411di/sem_07.ipynb notebook с занятия] | ||
+ | |- | ||
+ | | 19.04.2016 || Решающие деревья || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ssmbi9f3lkosral/decision_trees.ipynb notebook с занятия] | ||
+ | |- | ||
+ | | 26.04.2016 || Разбор первой части проекта || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/uh64e2mcu9dy924/project_s.ipynb notebook с занятия] | ||
+ | |- | ||
+ | | 10.05.2016 || Случайные леса. Метод главных компонент || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/7b4sdyvwx5o1keg/rf_pca.ipynb notebook1], | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ahk8sae6gb4y6yc/talgat_rf_pca.ipynb notebook2] | ||
+ | |- | ||
+ | | 17.05.2016 || Методы кластеризации, k-means. Метрики качества || | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/c2suozftb8s5679/clustering.ipynb notebook] | ||
+ | |- | ||
+ | | 24.05.2016 || Решение задачик с [http://hackerrank.com hackerrank.com] || | ||
+ | [https://www.hackerrank.com/challenges/battery [1]], | ||
+ | [https://www.hackerrank.com/challenges/stat-warmup [2]], | ||
+ | [https://www.hackerrank.com/challenges/predicting-house-prices [3]], | ||
+ | [https://www.hackerrank.com/challenges/predicting-office-space-price [4]], | ||
+ | [https://www.hackerrank.com/challenges/document-classification [5](*)] | ||
+ | |- | ||
+ | | 31.05.2016 || Метрические методы классификации. KNN || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/70gqz2jvm0z1cl7/KNN.ipynb ноутбук] | ||
+ | |- | ||
+ | | 07.06.2016 || Ассоциативные правила. APriori || [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qb9me3y2dnwunic/apriori.ipynb notebook с примером], [https://www.dropbox.com/s/zbtamhqgtvyxqbj/accidents.basket?dl=0 данные], [https://www.dropbox.com/s/n2w47t15m5dnfq1/features.csv?dl=0 описание признаков] | ||
+ | |} | ||
+ | |||
+ | ==Практические задания== | ||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/v6g0ld6y6vc5zmu/HW1_Username.ipynb Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"] | ||
+ | |||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/dtx4hnnwjmcrgiu/HW2_Username.ipynb Практическое задание №2 "Методы линейной регрессии"]. '''Обновлено 1.3.2016''' | ||
+ | |||
+ | [https://www.dropbox.com/s/ua7wc2vpoi5mdbr/hse_project.pdf?dl=0 Проект. Начало.] | ||
+ | |||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/tqhvg13spcwjtn1/HW4_Username.ipynb Практическое задание №3 "Решающие деревья"] | ||
+ | |||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/qudhpgdcaoljk61/project_2.ipynb Проект. Продолжение.] | ||
+ | |||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ind6wpytgkossal/HW4_Username.ipynb Практическое задание №4 "Логистическая регрессия и предобработка данных"]. Срок сдачи: 4.6.2016 | ||
+ | |||
+ | [https://www.dropbox.com/s/61qvambiq77ksnl/data.csv?dl=0 Данные для 4-го задания] | ||
+ | |||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/xjadj6v91blbufj/HW5_Username.ipynb Практическое задание №5 "Метод главных компонент"]. Срок сдачи: 15.6.2016 | ||
+ | |||
+ | [https://www.dropbox.com/s/oo3ev457tkg5jxe/data_task1.csv?dl=0 data_task1], [https://www.dropbox.com/s/ym5qsyrxwtyhma6/data_task2.csv?dl=0 data_task2] | ||
== Оформление писем == | == Оформление писем == | ||
Строка 42: | Строка 98: | ||
Задания вы можете выполнять как на [https://shad.people.yandex.net виртуальной машине], так и на своём компьютере. При этом нами рекомендуется второй вариант, потому что неработоспособность виртуальной машины не будет являться уважительной причиной для просрочки дедлайна. Руководство по установке iPython и необходимых библиотек находится [http://www.machinelearning.ru/wiki/images/1/10/MMP_Praktikum_317_2014a_Python.pdf здесь]. Для работы понадобится следующий базовый минимум установленных пакетов: Jupyter, iPython, NumPy, SciPy, Scikit-learn, Matplotlib. | Задания вы можете выполнять как на [https://shad.people.yandex.net виртуальной машине], так и на своём компьютере. При этом нами рекомендуется второй вариант, потому что неработоспособность виртуальной машины не будет являться уважительной причиной для просрочки дедлайна. Руководство по установке iPython и необходимых библиотек находится [http://www.machinelearning.ru/wiki/images/1/10/MMP_Praktikum_317_2014a_Python.pdf здесь]. Для работы понадобится следующий базовый минимум установленных пакетов: Jupyter, iPython, NumPy, SciPy, Scikit-learn, Matplotlib. | ||
+ | |||
+ | Также если решение задания вам нужно предоставить в виде ipython notebook, то наличие файла на виртуальной машине не является фактом сдачи, вам обязательно нужно отправить письмо на почту курса. |
Текущая версия на 21:39, 14 июня 2016
Содержание
Общая информация
Семинаристы: Гитман Игорь, Захаров Егор
Занятия проходят по вторникам 3-ей парой в аудитории 4335
Почта курса: hse.minor.dm@gmail.com (просьба указывать тему в соответствии с шаблоном)
Семинары
Дата | Тема | Материалы |
---|---|---|
12.01.2016 | Вводное занятие | |
19.01.2016 | Линейная алгебра, Python NumPy. Проверочная по вводному занятию |
notebook с занятия |
26.01.2016 | Работа с таблицами и визуализация, Python Pandas и Matplotlib. Проверочная по NumPy. Выдача первого домашнего задания |
|
02.02.2016 | Метод градиентного спуска на примере регрессии | |
09.02.2016 | Ликбез по статистике. Наивный байес | |
01.03.2016 | Линейная регрессия: Ridge, Lasso | |
15.03.2016 | Линейная классификация: Logistic Regression, метрики качества | |
19.04.2016 | Решающие деревья | |
26.04.2016 | Разбор первой части проекта | |
10.05.2016 | Случайные леса. Метод главных компонент | |
17.05.2016 | Методы кластеризации, k-means. Метрики качества | |
24.05.2016 | Решение задачик с hackerrank.com | |
31.05.2016 | Метрические методы классификации. KNN | ноутбук |
07.06.2016 | Ассоциативные правила. APriori | notebook с примером, данные, описание признаков |
Практические задания
Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"
Практическое задание №2 "Методы линейной регрессии". Обновлено 1.3.2016
Практическое задание №3 "Решающие деревья"
Практическое задание №4 "Логистическая регрессия и предобработка данных". Срок сдачи: 4.6.2016
Практическое задание №5 "Метод главных компонент". Срок сдачи: 15.6.2016
Оформление писем
Просьба придерживаться данного стиля оформления темы письма, иначе оно не будет получено:
- Вопросы: [ИАД-17] Вопрос
- Сдача заданий: [ИАД-17] Задание N, ФИО
Сдача домашних заданий
- Максимальная оценка за задание — 10 баллов + (при наличии) бонусные баллы
- Для каждого домашнего задания будет установлен дедлайн. Штраф за день просрочки: 0.2 балла, датой сдачи считается дата отправки письма с заданием
- Имена файлов, которые вы прикрепляете к письму, должны содержать вашу фамилию на латинице, например Ivanov.ipynb
- Просьба отправлять на почту курса только итоговую версию задания
Обращаем внимание, что плагиат будет строго наказываться.
Задания вы можете выполнять как на виртуальной машине, так и на своём компьютере. При этом нами рекомендуется второй вариант, потому что неработоспособность виртуальной машины не будет являться уважительной причиной для просрочки дедлайна. Руководство по установке iPython и необходимых библиотек находится здесь. Для работы понадобится следующий базовый минимум установленных пакетов: Jupyter, iPython, NumPy, SciPy, Scikit-learn, Matplotlib.
Также если решение задания вам нужно предоставить в виде ipython notebook, то наличие файла на виртуальной машине не является фактом сдачи, вам обязательно нужно отправить письмо на почту курса.