Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-18 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 72: Строка 72:
 
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],  
 
[https://www.hackerrank.com/challenges/predicting-office-space-price [4]],  
 
[https://www.hackerrank.com/challenges/document-classification [5](*)]
 
[https://www.hackerrank.com/challenges/document-classification [5](*)]
 +
|-
 +
|31 мая 2016 || align="center"|14 || Метрические алгоритмы. Метод ближайших соседей||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/70gqz2jvm0z1cl7/KNN.ipynb KNN_notebook ]
 
  |}
 
  |}
  

Версия 16:41, 31 мая 2016

Общая информация

  • Семинары в поддержку курса Введение в анализ данных .
  • Семинаристы: Игорь Гитман и Анастасия Рысьмятова.
  • Почта: "hse.minor.dm+18@gmail.com"


Выставление оценки

  1. На семинарах по некоторым темам будут проводиться проверочные работы.
  2. Также за курс будут выданы несколько практических заданий, которые будут оцениваться по десятибалльной шкале. На выполнение каждого практического задание будет даваться 2 недели. Штраф за просрочку сдачи составляет 0.2 балла в день.
  3. Оценка за работу в семестре будет ставиться исходя из набранных баллов.
  4. В конце семестра разрешается переписать одну пропущенную по любой причине проверочную работу. Также разрешается переписать все проверочные, пропущенные по уважительной причине.
  5. Результаты работ ИАД - 18

Расписание семинаров

Дата № занятия Занятие Материалы
12 января 2016 1 Вводный семинар. Обсуждение основных понятий анализа данных.

Неструктурированные материалы

19 января 2016 2 Python для анализа данных. NumPy. ipython notebook с семинара
26 января 2016 3 Python для анализа данных. Pandas. Matplotlib.

ipython notebook с семинара

02 февраля 2016 4 Решение задач.

задачи

09 февраля 2016 5 Градиентный спуск. Линейная регрессия.

ipython notebook с семинара

слайды

16 февраля 2016 6 Градиентный спуск.
01 марта 2016 7 Градиентный спуск. Понятия Ridge и Lasso регрессии.

Домашнее задание

15 марта 2016 8 Теория вероятностей. Решение задач на формулу полной вероятности и формулу Байеса.

Задачи

15 марта 2016 9 Консультация. Ridge и Lasso регрессии.

ipython notebook

22 марта 2016 10 Линейные алгоритмы классификации. Логистическая регрессия.
5 апреля 2016 11 Подготовка к коллоквиуму.
19 апреля 2016 12 Решающие деревья.

ipython notebook

26 апреля 2016 13 Пример работы с реальными данными (разбор проекта).

ipython notebook

10 мая 2016 14 Случайные леса (Random Forest). Метод главных компонент (PCA).

RF_notebook PCA_notebook

24 мая 2016 16 Решение задачик с hackerrank.com

[1], [2], [3], [4], [5(*)]

31 мая 2016 14 Метрические алгоритмы. Метод ближайших соседей

KNN_notebook

Практические задания

Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"

Практическое задание №2 "Методы линейной регрессии"

Проект. Начало. (student-mat.csv, student-por.csv)


Практическое задание №3 "DecisionTree"

Практическое задание №4 "Random Forest, KNN"