Современные методы машинного обучения (курс майнора) 2017/2018 ИАД1

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Майнор по курсу СММО - 2017/2018 учебный год - ИАД-1 и ИАД-2

На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2

Семинарист: Панов Александр [1]
При обращении по почте, начинайте тему письма со слов [Майнор ИАД]

UPDATE! Вопросы по ДЗ нужно и можно задавать ассистентам групп:
1) ИАД-1 - Мария Головина (Telegram @msgolovina),
2) ИАД-2 - Владислав Скрипнюк (Telegram @skripniuk).

Страница курса
Анонимные комментарии, замечания и пожелания можно оставить здесь
Репозиторий курса - https://github.com/grafft/hse-tasks/tree/master/minor-aml-17

ИТОГОВЫЕ оценки смотрите в таблице курса. Зеленые - автомат, желтые - на экзамен, красные - таких не знаем.

Семинары

1) 7 сентября 2017: Метод опорных векторов и ядра - тетрадка, опрос
2) 21 сентября 2017: Методы оптимизации - тетрадка, данные1, данные2, опрос
3) 28 сентября 2017: Предобработка данных - тетрадка, опрос
4) 5 октября 2017: Бустинг - основная, дополнительная, опрос
5) 12 октября 2017: Нейронные сети: начало - тетрадка MLP, тетрадка TF, опрос
6) 19 октября 2017: Нейронные сети: продолжение- тетрадка TF conv, тетрадка Keras, опрос
7) 2 ноября 2017: Статисткиа: распределения - тетрадка 1, тетрадка 2
8) 9 ноября 2017: Статистика: критерии - папка с тетрадками, опрос
9) 16 ноября 2017: Нейронные сети: рекуррентные - папка с тетрадками, опрос
10) 23 ноября 2017: Статистика: гипотезы и корреляции - папка с тетрадками, опрос
11) 7 декабря 2017: Статистика: временные ряды - папка с тетрадкой и данными
12) 14 декабря 2017: Статистика: регрессия - папка с тетрадкой и данными

Домашние Задания

1) ДЗ 1: SVM - тетрадка, данные1, данные2. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW1<Фамилия>.ipynb - например IDA1HW1Panov.ipynb. Срок - 9 октября 2017, 23:59.
2) ДЗ 2: Бустинг - тетрадка, данные, статья. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW2<Фамилия>.ipynb - например IDA1HW2Panov.ipynb. Срок - 22 октября 2017, 23:59.
3) ДЗ 3: Нейросети - тетрадка, данные. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW3<Фамилия>.ipynb - например IDA1HW3Panov.ipynb. Срок - 3 декабря 2017, 23:59.
3) ДЗ 4: Статистика. Задание: выбрать любой временной ряд, который вы будете прогнозировать; лучше взять ряд с месячным или квартальным разрешением, длиной от 100 отсчётов и не слишком простой (не выглядящий как константа или другая простая функция), иначе вам будет скучно его прогнозировать; внести выбранный ряд в таблицу, убедившись, что никто другой его не взял - если несколько студентов будут прогнозировать один и тот же ряд, задача не будет засчитана никому из них; проанализировать выбранный ряд по аналогии с примером, разбиравшимся на семинаре, и построить его прогноз на 3 года вперёд с помощью модели класса ARIMA. Если вы не знаете, где можно брать ряды, смотрите источнике ниже - в разделе "Полезные ссылки". Готовые решения (только файл ipynb! со ссылкой на ряд) отправлять в Dropbox с названием файла IDA<Номер группы>HW4<Фамилия>.ipynb - например IDA1HW4Panov.ipynb. Срок - 14 декабря 2017, 23:59.

Полезные ссылки (Будут пополняться)

Семинар 1

  1. Пример работы полиномиального ядра
  2. Описание ядер
  3. Еще про SVM

Полезные визуализации

  1. [2] Нейросети, распределения и т.п.

Pandas & Seaborn

  1. Pandas
  2. Effective Pandas
  3. Pandas Cheat-Sheet
  4. Pandas Visualization
  5. Seaborn

Наборы данных

  1. Портал Открытых Данных РФ
  2. Funny Datasets
  3. Сборник Открытых Данных (!!!)
  4. Еще наборы данных

FYI

  1. Spurious Correlations
  2. Correlation

Python

  1. PEP-8 Code Style Guide Cheat-sheet
  2. Python Tutorials Point
  3. Matplotlib Tutorial
  4. Matrix Manipulation Cheat-sheet
  5. Ipython Notebook
  6. Beaker Notebook
  7. yhat Rodeo

Ресурсы и Книги

  1. James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
  2. Bishop — Pattern Recognition and Machine Learning (первые главы)
  3. MachineLearning.ru
  4. Kaggle
  5. UCI Repo
  6. Visual Intro to ML

Онлайн Курсы

  1. Andrew Ng's Course
  2. Introduction to ML
  3. Learning Data Science with Python
  4. Курс от ВШЭ
  5. Обзор МООС Курсов

Временные ряды

  1. https://datamarket.com/data/list/?q=cat:edb interval:month provider:tsdl
  2. http://sophist.hse.ru/hse/nindex.shtml
  3. https://stat.yandex.ru/
  4. https://www.quandl.com/browse?idx=database-browser_economic-data.