Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-18 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Расписание семинаров)
Строка 56: Строка 56:
 
|26 апреля 2016 || align="center"|11 || Пример работы с реальными данными (разбор проекта) ||  
 
|26 апреля 2016 || align="center"|11 || Пример работы с реальными данными (разбор проекта) ||  
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/uh64e2mcu9dy924/project_s.ipynb ipython notebook]
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/uh64e2mcu9dy924/project_s.ipynb ipython notebook]
 +
|-
 +
|10 мая 2016 || align="center"|12 || Случайные леса (Random Forest). Метод главных компонент (PCA).  ||
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/9e1vabeu5fpm9ch/decision_trees.ipynb RF_notebook ]
 +
 +
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/rhipwex1oz4av9r/PCA.ipynb PCA_notebook]
 
  |}
 
  |}
  

Версия 14:13, 10 мая 2016

Общая информация

  • Семинары в поддержку курса Введение в анализ данных .
  • Семинаристы: Игорь Гитман и Анастасия Рысьмятова.
  • Почта: "hse.minor.dm+18@gmail.com"


Выставление оценки

  1. На семинарах по некоторым темам будут проводиться проверочные работы.
  2. Также за курс будут выданы несколько практических заданий, которые будут оцениваться по десятибалльной шкале. На выполнение каждого практического задание будет даваться 2 недели. Штраф за просрочку сдачи составляет 0.2 балла в день.
  3. Оценка за работу в семестре будет ставиться исходя из набранных баллов.
  4. В конце семестра разрешается переписать одну пропущенную по любой причине проверочную работу. Также разрешается переписать все проверочные, пропущенные по уважительной причине.
  5. Результаты работ ИАД - 18

Расписание семинаров

Дата № занятия Занятие Материалы
12 января 2016 1 Вводный семинар. Обсуждение основных понятий анализа данных.

Неструктурированные материалы

19 января 2016 2 Python для анализа данных. NumPy. ipython notebook с семинара
26 января 2016 3 Python для анализа данных. Pandas. Matplotlib.

ipython notebook с семинара

02 февраля 2016 4 Решение задач.

задачи

09 февраля 2016 5 Градиентный спуск. Линейная регрессия.

ipython notebook с семинара

слайды

16 февраля 2016 6 Градиентный спуск.
01 марта 2016 7 Градиентный спуск. Понятия Ridge и Lasso регрессии.

Домашнее задание

15 марта 2016 8 Теория вероятностей. Решение задач на формулу полной вероятности и формулу Байеса.

Задачи

15 марта 2016 9 Консультация. Ridge и Lasso регрессии.

ipython notebook

19 апреля 2016 10 Решающие деревья

ipython notebook

26 апреля 2016 11 Пример работы с реальными данными (разбор проекта)

ipython notebook

10 мая 2016 12 Случайные леса (Random Forest). Метод главных компонент (PCA).

RF_notebook

PCA_notebook

Практические задания

Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"

Практическое задание №2 "Методы линейной регрессии"

Проект. Начало. (student-mat.csv, student-por.csv)


Практическое задание №3 "DecisionTree"