Майнор Интеллектуальный анализ данных/Введение в анализ данных/ИАД-18 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Расписание семинаров)
Строка 51: Строка 51:
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/t8fum2v9zuaduwz/sem_6.ipynb ipython notebook]
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/t8fum2v9zuaduwz/sem_6.ipynb ipython notebook]
 
|-
 
|-
|19 апреля 2016 || align="center"|10 || Решающие деревья ||  
+
|5 апреля 2016 || align="center"|10 || Подготовка к коллоквиуму. ||
 +
 
 +
|-
 +
|19 апреля 2016 || align="center"|11 || Решающие деревья. ||  
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ssmbi9f3lkosral/decision_trees.ipynb ipython notebook]
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/ssmbi9f3lkosral/decision_trees.ipynb ipython notebook]
 
|-
 
|-
|26 апреля 2016 || align="center"|11 || Пример работы с реальными данными (разбор проекта) ||  
+
|26 апреля 2016 || align="center"|12 || Пример работы с реальными данными (разбор проекта). ||  
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/uh64e2mcu9dy924/project_s.ipynb ipython notebook]
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/uh64e2mcu9dy924/project_s.ipynb ipython notebook]
 
|-
 
|-
|10 мая 2016 || align="center"|12 || Случайные леса (Random Forest). Метод главных компонент (PCA).  ||  
+
|10 мая 2016 || align="center"|13 || Случайные леса (Random Forest). Метод главных компонент (PCA).  ||  
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/9e1vabeu5fpm9ch/decision_trees.ipynb RF_notebook ]
 
[http://nbviewer.jupyter.org/urls/dl.dropbox.com/s/9e1vabeu5fpm9ch/decision_trees.ipynb RF_notebook ]
  

Версия 14:49, 10 мая 2016

Общая информация

  • Семинары в поддержку курса Введение в анализ данных .
  • Семинаристы: Игорь Гитман и Анастасия Рысьмятова.
  • Почта: "hse.minor.dm+18@gmail.com"


Выставление оценки

  1. На семинарах по некоторым темам будут проводиться проверочные работы.
  2. Также за курс будут выданы несколько практических заданий, которые будут оцениваться по десятибалльной шкале. На выполнение каждого практического задание будет даваться 2 недели. Штраф за просрочку сдачи составляет 0.2 балла в день.
  3. Оценка за работу в семестре будет ставиться исходя из набранных баллов.
  4. В конце семестра разрешается переписать одну пропущенную по любой причине проверочную работу. Также разрешается переписать все проверочные, пропущенные по уважительной причине.
  5. Результаты работ ИАД - 18

Расписание семинаров

Дата № занятия Занятие Материалы
12 января 2016 1 Вводный семинар. Обсуждение основных понятий анализа данных.

Неструктурированные материалы

19 января 2016 2 Python для анализа данных. NumPy. ipython notebook с семинара
26 января 2016 3 Python для анализа данных. Pandas. Matplotlib.

ipython notebook с семинара

02 февраля 2016 4 Решение задач.

задачи

09 февраля 2016 5 Градиентный спуск. Линейная регрессия.

ipython notebook с семинара

слайды

16 февраля 2016 6 Градиентный спуск.
01 марта 2016 7 Градиентный спуск. Понятия Ridge и Lasso регрессии.

Домашнее задание

15 марта 2016 8 Теория вероятностей. Решение задач на формулу полной вероятности и формулу Байеса.

Задачи

15 марта 2016 9 Консультация. Ridge и Lasso регрессии.

ipython notebook

5 апреля 2016 10 Подготовка к коллоквиуму.
19 апреля 2016 11 Решающие деревья.

ipython notebook

26 апреля 2016 12 Пример работы с реальными данными (разбор проекта).

ipython notebook

10 мая 2016 13 Случайные леса (Random Forest). Метод главных компонент (PCA).

RF_notebook

PCA_notebook

Практические задания

Практическое задание №1 "Изучение Numpy, Pandas, Matplotlib"

Практическое задание №2 "Методы линейной регрессии"

Проект. Начало. (student-mat.csv, student-por.csv)


Практическое задание №3 "DecisionTree"