Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-18 — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Igtm (обсуждение | вклад) (→Расписание семинаров) |
Igtm (обсуждение | вклад) (→Практические задания) |
||
Строка 97: | Строка 97: | ||
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/93s0tyzp0c5ey8y/project2.ipynb Проект. Продолжение.] ([https://www.dropbox.com/s/obcxbpwawie3zqy/student-mat.csv?dl=0 student-mat.csv], [https://www.dropbox.com/s/37pxauy419lakz5/student-por.csv?dl=0 student-por.csv]) | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/93s0tyzp0c5ey8y/project2.ipynb Проект. Продолжение.] ([https://www.dropbox.com/s/obcxbpwawie3zqy/student-mat.csv?dl=0 student-mat.csv], [https://www.dropbox.com/s/37pxauy419lakz5/student-por.csv?dl=0 student-por.csv]) | ||
+ | |||
+ | [http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/xjadj6v91blbufj/HW5_Username.ipynb Практическое задание №5 "Метод главных компонент"]. Срок сдачи: 19.06.2016 (задание не является обязательным!) | ||
+ | |||
+ | [https://www.dropbox.com/s/oo3ev457tkg5jxe/data_task1.csv?dl=0 data_task1], [https://www.dropbox.com/s/ym5qsyrxwtyhma6/data_task2.csv?dl=0 data_task2] |
Версия 18:40, 7 июня 2016
Общая информация
|
Выставление оценки
- На семинарах по некоторым темам будут проводиться проверочные работы.
- Также за курс будут выданы несколько практических заданий, которые будут оцениваться по десятибалльной шкале. На выполнение каждого практического задание будет даваться 2 недели. Штраф за просрочку сдачи составляет 0.2 балла в день.
- Оценка за работу в семестре будет ставиться исходя из набранных баллов.
- В конце семестра разрешается переписать одну пропущенную по любой причине проверочную работу. Также разрешается переписать все проверочные, пропущенные по уважительной причине.
- Результаты работ ИАД - 18
Расписание семинаров
Дата | № занятия | Занятие | Материалы |
---|---|---|---|
12 января 2016 | 1 | Вводный семинар. Обсуждение основных понятий анализа данных. | |
19 января 2016 | 2 | Python для анализа данных. NumPy. | ipython notebook с семинара |
26 января 2016 | 3 | Python для анализа данных. Pandas. Matplotlib. | |
02 февраля 2016 | 4 | Решение задач. | |
09 февраля 2016 | 5 | Градиентный спуск. Линейная регрессия. | |
16 февраля 2016 | 6 | Градиентный спуск. | |
01 марта 2016 | 7 | Градиентный спуск. Понятия Ridge и Lasso регрессии. | |
15 марта 2016 | 8 | Теория вероятностей. Решение задач на формулу полной вероятности и формулу Байеса. | |
15 марта 2016 | 9 | Консультация. Ridge и Lasso регрессии. | |
22 марта 2016 | 10 | Линейные алгоритмы классификации. Логистическая регрессия. | |
5 апреля 2016 | 11 | Подготовка к коллоквиуму. | |
19 апреля 2016 | 12 | Решающие деревья. | |
26 апреля 2016 | 13 | Пример работы с реальными данными (разбор проекта). | |
10 мая 2016 | 14 | Случайные леса (Random Forest). Метод главных компонент (PCA). | |
17 мая 2016 | 15 | Кластеризация. | |
24 мая 2016 | 16 | Решение задачик с hackerrank.com | |
31 мая 2016 | 17 | Метрические алгоритмы. Метод ближайших соседей. | |
7 июня 2016 | 18 | Поиск ассоциативных правил. Алгоритм APriori |
Практические задания
Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"
Практическое задание №2 "Методы линейной регрессии"
Проект. Начало. (student-mat.csv, student-por.csv)
Практическое задание №3 "DecisionTree"
Практическое задание №4 "Random Forest, KNN"
Проект. Продолжение. (student-mat.csv, student-por.csv)
Практическое задание №5 "Метод главных компонент". Срок сдачи: 19.06.2016 (задание не является обязательным!)