Minor da2016 gr3

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Майнор по Анализу Данных -- ИАД-3

На данной странице будут вывешиваться последние новости и материалы для семинарских занятий группы ИАД-3

Семинарист: Шестаков Андрей shestakoffandrey@gmail.com
При обращении по почте, начинайте тему письма со слов [Майнор ИАД 2016]

Страница курса
Вопросы к коллоквиуму
Пройдите опрос!
Таблица с результатами содержится здесь
Анонимные комментарии, замечания и пожелания можно оставить здесь

Семинары

1) 12 Января 2016: Введение в Python, настройка среды программирования - IPython Notebook
2) 19 Января 2016: Исследование данных с помощью Pandas и Seaborn - IPython Notebook
3) 26 Января 2016: Элементы работы с матрицами. Меры расстояний и сходства - IPython Notebook
4) 2 Февраля 2016: Оптимизация функций. Символьные вычисления - IPython Notebook
5) 9 Февраля 2016: Вероятность и мат. статистика, ч. 1 - IPython Notebook
6) 16 Февраля 2016: Вероятность и мат. статистика, ч. 2 - IPython Notebook
7) 1 Марта 2016: Линейная регрессия - IPython Notebook
8) 15 Марта 2016: Линейные методы классификации - IPython Notebook
9) 22 Марта 2016: + оценка качества, кросс-валидация - IPython Notebook
10) 5 Апреля 2016: Консультация перед коллоквиумом
11) 19 Апреля 2016: Деревья решений - IPython Notebook
12) 26 Апреля 2016: Разбор одного проекта IPython Notebook, Данные
13) 10 Мая 2016 Ансамблевые методы. Методы понижения размерности данных IPython Notebook
13) 17 Мая 2016 Работа в программе Orange Orange File

Домашние Задания

ДЗ 1. Срок - 2 февраля 2016
ДЗ 2. Срок - 20 февраля 2016
ДЗ 3. Срок - 4 марта 2016
ДЗ 4. Срок - 20 мая 2016

Проект

Задание на проект
Согласование состава группы и набора данных: 25.03.2016 23:59
Срок сдачи первой части: 11.04.2016 23:59
Срок сдачи второй части: 10 дней до даты защиты проекта

Полезные ссылки (Будут пополняться)

Семинар 12

Ensemble methods

  1. Ensemble Learning Wikipedia
  2. Sklearn Ensemble Learning
  3. Bias-Variance and Ensemble Methods

Feature Selection\Dimention Reduction

  1. Dimention Reduction Overview
  2. Publication on Feature Selection

Семинар 9

  1. ROC-Curve Introduction
  2. sklearn Cross-Validation Routines

Семинар 8

  1. On Logistic Regression with examples
  2. Perceptron Algorithm
  3. On Linear Classifiers

Семинар 7

  1. Sklearn Linear Models
  2. Statmodels Examples

Семинар 6

  1. SciPy Stats reference

Семинар 5

  1. Good Intro to Probability and Statistics
  2. Probability Cheat-Sheet
  3. Naive Bayes
  4. Monte-Carlo

Семинар 4

Optimization

  1. Gradient Descent - Coursera
  2. Regression Lecture Notes
  3. Optimization Methods in Scipy
  4. 3D plotting in Matplotlib

Семинар 3

Probability And Linear Algebra

  1. Matrix Cookbook
  2. PCA Tutorial
  3. Probability & Statistics Cheat-Sheet

Семинар 2

Pandas & Seaborn

  1. Pandas
  2. Pandas Cheat-Sheet
  3. Pandas Visualization
  4. Seaborn

Наборы данных

  1. Портал Открытых Данных РФ
  2. Funny Datasets
  3. Сборник Открытых Данных (!!!)
  4. Еще наборы данных

FYI

  1. Spurious Correlations
  2. Correlation

Семинар 1

Python

  1. PEP-8 Code Style Guide Cheat-sheet
  2. Python Tutorials Point
  3. Matplotlib Tutorial
  4. Matrix Manipulation Cheat-sheet
  5. Ipython Notebook
  6. Beaker Notebook
  7. yhat Rodeo

Ресурсы и Книги

  1. James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
  2. Bishop — Pattern Recognition and Machine Learning (первые главы)
  3. MachineLearning.ru
  4. Kaggle
  5. UCI Repo

Онлайн Курсы

  1. Andrew Ng's Course
  2. Introduction to ML
  3. Learning Data Science with Python
  4. Курс от ВШЭ
  5. Обзор МООС Курсов