Современные методы машинного обучения (курс майнора) 2017/2018 ИАД1 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «__TOC__ == Майнор по курсу "Современные методы машинного обучения" - 2017/2018 учебный год - ИАД-1 и…»)
 
 
(не показаны 33 промежуточные версии этого же участника)
Строка 1: Строка 1:
 
__TOC__
 
__TOC__
== Майнор по курсу "Современные методы машинного обучения" - 2017/2018 учебный год - ИАД-1 и ИАД-2==
+
== Майнор по курсу СММО - 2017/2018 учебный год - ИАД-1 и ИАД-2==
  
 
На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2
 
На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2
Строка 6: Строка 6:
 
Семинарист: [[Участник:Panov.ai | Панов Александр]] [mailto:apanov@hse.ru] <br/>
 
Семинарист: [[Участник:Panov.ai | Панов Александр]] [mailto:apanov@hse.ru] <br/>
 
При обращении по почте, начинайте тему письма со слов ''[Майнор ИАД]''
 
При обращении по почте, начинайте тему письма со слов ''[Майнор ИАД]''
 +
 +
'''UPDATE!''' Вопросы по ДЗ нужно и можно задавать ассистентам групп: <br/>
 +
1) ИАД-1 - [http://t.me/msgolovina Мария Головина] (Telegram @msgolovina), <br/>
 +
2) ИАД-2 - [http://t.me/skripniuk Владислав Скрипнюк] (Telegram @skripniuk). <br/>
  
 
''' [http://wiki.cs.hse.ru/Современные_методы_машинного_обучения_(курс_майнора)_2017/2018 Страница] курса''' <br/>
 
''' [http://wiki.cs.hse.ru/Современные_методы_машинного_обучения_(курс_майнора)_2017/2018 Страница] курса''' <br/>
'''Анонимные''' комментарии, замечания и пожелания можно оставить [https://goo.gl/forms/eyYRTv379a9mj7Tr2 здесь]<br/>.
+
'''Анонимные''' комментарии, замечания и пожелания можно оставить [https://goo.gl/forms/eyYRTv379a9mj7Tr2 здесь]<br/>
 +
Репозиторий курса - [https://github.com/grafft/hse-tasks/tree/master/minor-aml-17 https://github.com/grafft/hse-tasks/tree/master/minor-aml-17]<br/>
  
== Семинары ==
+
'''ИТОГОВЫЕ оценки''' смотрите в [https://docs.google.com/spreadsheets/d/1ly3c1qjaDDOYW-u7za1Gqm_EYRM6qUjnF0ARjvaT570 таблице курса]. Зеленые - автомат, желтые - на экзамен, красные - таких не знаем.
'''1) 7 сентября 2017:''' Метод опорных векторов. Ядра. - [[http://nbviewer.jupyter.org/github/grafft/hse-tasks/blob/master/minor-aml-17/seminar1/1_svm.ipynb IPython Notebook]] <br/>
+
  
 +
== Семинары ==
 +
'''1) 7 сентября 2017:''' Метод опорных векторов и ядра - [http://nbviewer.jupyter.org/github/grafft/hse-tasks/blob/master/minor-aml-17/seminar1/1_svm.ipynb тетрадка], [https://goo.gl/forms/1byeOJg3la09woPe2 опрос] <br/>
 +
'''2) 21 сентября 2017:''' Методы оптимизации - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar2/2_gradient_descent.ipynb тетрадка], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar2/food_trucks.txt данные1], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar2/space_ga.txt данные2], [https://goo.gl/forms/aBxtq6Gg5ameNlpr1 опрос] <br/>
 +
'''3) 28 сентября 2017:''' Предобработка данных - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar3/3_missing.ipynb тетрадка], [https://goo.gl/forms/LU2QtGA4bDFUdo8z1 опрос] <br/>
 +
'''4) 5 октября 2017:''' Бустинг - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar4/4_boosting_adv.ipynb основная], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar4/xgboost_test.ipynb дополнительная], опрос <br/>
 +
'''5) 12 октября 2017:''' Нейронные сети: начало - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar5/5_mlp.ipynb тетрадка MLP], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar5/5_tf_mlp.ipynb тетрадка TF], [https://goo.gl/forms/TJ7w62qnyuT3nLMz2 опрос] <br/>
 +
'''6) 19 октября 2017:''' Нейронные сети: продолжение- [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar5/5_tf_conv.ipynb тетрадка TF conv], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar6/6_keras_start.ipynb тетрадка Keras], [https://goo.gl/forms/LcXXb0VYvGJAzJec2 опрос] <br/>
 +
'''7) 2 ноября 2017:''' Статисткиа: распределения - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar7/7_stat_distr.ipynb тетрадка 1], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar7/7_stat_select.ipynb тетрадка 2]<br/>
 +
'''8) 9 ноября 2017:'''  Статистика: критерии - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar8 папка с тетрадками], [https://goo.gl/forms/q6NOfABn8EquAnxc2 опрос] <br/>
 +
'''9) 16 ноября 2017:'''  Нейронные сети: рекуррентные - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar9 папка с тетрадками], [https://goo.gl/forms/q6NOfABn8EquAnxc2 опрос] <br/>
 +
'''10) 23 ноября 2017:'''  Статистика: гипотезы и корреляции - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar10 папка с тетрадками],  опрос<br/>
 +
'''11) 7 декабря 2017:'''  Статистика: временные ряды - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar11 папка с тетрадкой и данными]<br/>
 +
'''12) 14 декабря 2017:'''  Статистика: регрессия - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar12 папка с тетрадкой и данными]<br/>
  
 
== Домашние Задания ==
 
== Домашние Задания ==
 
+
'''1) ДЗ 1: SVM''' - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw1/hw1-svm.ipynb тетрадка], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw1/data.zip данные1], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw1/titanium.csv данные2]. Готовые решения (только файл ipynb!) отправлять в [https://www.dropbox.com/request/CuFAJ5bY0y7LCzqyYkc1 Dropbox] с названием файла '''IDA<Номер группы>HW1<Фамилия>.ipynb''' - например IDA1HW1Panov.ipynb. Срок - 9 октября 2017, 23:59. <br/>
 +
'''2) ДЗ 2: Бустинг''' - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw2/hw2.ipynb тетрадка], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw2/data.zip данные], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw2/paper.pdf статья]. Готовые решения (только файл ipynb!) отправлять в [https://www.dropbox.com/request/sc22z368B3GSxxudlSRb Dropbox] с названием файла '''IDA<Номер группы>HW2<Фамилия>.ipynb''' - например IDA1HW2Panov.ipynb. Срок - 22 октября 2017, 23:59. <br/>
 +
'''3) ДЗ 3: Нейросети''' - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw3/hw3.ipynb тетрадка], [https://www.dropbox.com/s/y62of919dlasyzs/images.npy?dl=0 данные]. Готовые решения (только файл ipynb!) отправлять в [https://www.dropbox.com/request/ZpCjSqeP4f8dOyByqgSb Dropbox] с названием файла '''IDA<Номер группы>HW3<Фамилия>.ipynb''' - например IDA1HW3Panov.ipynb. Срок - 3 декабря 2017, 23:59. <br/>
 +
'''3) ДЗ 4: Статистика'''. Задание: выбрать любой временной ряд, который вы будете прогнозировать; лучше взять ряд с месячным или квартальным разрешением, длиной от 100 отсчётов и не слишком простой (не выглядящий как константа или другая простая функция), иначе вам будет скучно его прогнозировать; внести выбранный ряд в [https://docs.google.com/spreadsheets/d/1NXTSQfIkAAHHnslrOVb2e0syP3Q3SHz0oZ_7qVor5Lg/edit#gid=0 таблицу], убедившись, что никто другой его не взял - если несколько студентов будут прогнозировать один и тот же ряд, задача не будет засчитана никому из них; проанализировать выбранный ряд по аналогии с примером, разбиравшимся на семинаре, и построить его прогноз на 3 года вперёд с помощью модели класса ARIMA. Если вы не знаете, где можно брать ряды, смотрите источнике ниже - в разделе "Полезные ссылки". Готовые решения (только файл ipynb! со ссылкой на ряд) отправлять в [https://www.dropbox.com/request/Gdn1yrYOEdIHxgkZLpSB Dropbox] с названием файла '''IDA<Номер группы>HW4<Фамилия>.ipynb''' - например IDA1HW4Panov.ipynb. Срок - 14 декабря 2017, 23:59.
  
 
== Полезные ссылки (Будут пополняться) ==
 
== Полезные ссылки (Будут пополняться) ==
Строка 22: Строка 42:
 
# [http://crsouza.com/2010/03/17/kernel-functions-for-machine-learning-applications/ Описание ядер]
 
# [http://crsouza.com/2010/03/17/kernel-functions-for-machine-learning-applications/ Описание ядер]
 
# [http://www.ccas.ru/voron/download/SVM.pdf Еще про SVM]
 
# [http://www.ccas.ru/voron/download/SVM.pdf Еще про SVM]
 +
 +
''Полезные визуализации''
 +
# [http://colah.github.io/] Нейросети, распределения и т.п.
  
 
'' Pandas & Seaborn ''
 
'' Pandas & Seaborn ''
Строка 63: Строка 86:
 
# [https://www.coursera.org/learn/introduction-machine-learning Курс от ВШЭ]
 
# [https://www.coursera.org/learn/introduction-machine-learning Курс от ВШЭ]
 
# [http://habrahabr.ru/post/248069/ Обзор МООС Курсов]
 
# [http://habrahabr.ru/post/248069/ Обзор МООС Курсов]
 +
 +
'''Временные ряды'''
 +
# https://datamarket.com/data/list/?q=cat:edb interval:month provider:tsdl
 +
# http://sophist.hse.ru/hse/nindex.shtml
 +
# https://stat.yandex.ru/
 +
# https://www.quandl.com/browse?idx=database-browser_economic-data.

Текущая версия на 11:51, 18 декабря 2017

Майнор по курсу СММО - 2017/2018 учебный год - ИАД-1 и ИАД-2

На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2

Семинарист: Панов Александр [1]
При обращении по почте, начинайте тему письма со слов [Майнор ИАД]

UPDATE! Вопросы по ДЗ нужно и можно задавать ассистентам групп:
1) ИАД-1 - Мария Головина (Telegram @msgolovina),
2) ИАД-2 - Владислав Скрипнюк (Telegram @skripniuk).

Страница курса
Анонимные комментарии, замечания и пожелания можно оставить здесь
Репозиторий курса - https://github.com/grafft/hse-tasks/tree/master/minor-aml-17

ИТОГОВЫЕ оценки смотрите в таблице курса. Зеленые - автомат, желтые - на экзамен, красные - таких не знаем.

Семинары

1) 7 сентября 2017: Метод опорных векторов и ядра - тетрадка, опрос
2) 21 сентября 2017: Методы оптимизации - тетрадка, данные1, данные2, опрос
3) 28 сентября 2017: Предобработка данных - тетрадка, опрос
4) 5 октября 2017: Бустинг - основная, дополнительная, опрос
5) 12 октября 2017: Нейронные сети: начало - тетрадка MLP, тетрадка TF, опрос
6) 19 октября 2017: Нейронные сети: продолжение- тетрадка TF conv, тетрадка Keras, опрос
7) 2 ноября 2017: Статисткиа: распределения - тетрадка 1, тетрадка 2
8) 9 ноября 2017: Статистика: критерии - папка с тетрадками, опрос
9) 16 ноября 2017: Нейронные сети: рекуррентные - папка с тетрадками, опрос
10) 23 ноября 2017: Статистика: гипотезы и корреляции - папка с тетрадками, опрос
11) 7 декабря 2017: Статистика: временные ряды - папка с тетрадкой и данными
12) 14 декабря 2017: Статистика: регрессия - папка с тетрадкой и данными

Домашние Задания

1) ДЗ 1: SVM - тетрадка, данные1, данные2. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW1<Фамилия>.ipynb - например IDA1HW1Panov.ipynb. Срок - 9 октября 2017, 23:59.
2) ДЗ 2: Бустинг - тетрадка, данные, статья. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW2<Фамилия>.ipynb - например IDA1HW2Panov.ipynb. Срок - 22 октября 2017, 23:59.
3) ДЗ 3: Нейросети - тетрадка, данные. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW3<Фамилия>.ipynb - например IDA1HW3Panov.ipynb. Срок - 3 декабря 2017, 23:59.
3) ДЗ 4: Статистика. Задание: выбрать любой временной ряд, который вы будете прогнозировать; лучше взять ряд с месячным или квартальным разрешением, длиной от 100 отсчётов и не слишком простой (не выглядящий как константа или другая простая функция), иначе вам будет скучно его прогнозировать; внести выбранный ряд в таблицу, убедившись, что никто другой его не взял - если несколько студентов будут прогнозировать один и тот же ряд, задача не будет засчитана никому из них; проанализировать выбранный ряд по аналогии с примером, разбиравшимся на семинаре, и построить его прогноз на 3 года вперёд с помощью модели класса ARIMA. Если вы не знаете, где можно брать ряды, смотрите источнике ниже - в разделе "Полезные ссылки". Готовые решения (только файл ipynb! со ссылкой на ряд) отправлять в Dropbox с названием файла IDA<Номер группы>HW4<Фамилия>.ipynb - например IDA1HW4Panov.ipynb. Срок - 14 декабря 2017, 23:59.

Полезные ссылки (Будут пополняться)

Семинар 1

  1. Пример работы полиномиального ядра
  2. Описание ядер
  3. Еще про SVM

Полезные визуализации

  1. [2] Нейросети, распределения и т.п.

Pandas & Seaborn

  1. Pandas
  2. Effective Pandas
  3. Pandas Cheat-Sheet
  4. Pandas Visualization
  5. Seaborn

Наборы данных

  1. Портал Открытых Данных РФ
  2. Funny Datasets
  3. Сборник Открытых Данных (!!!)
  4. Еще наборы данных

FYI

  1. Spurious Correlations
  2. Correlation

Python

  1. PEP-8 Code Style Guide Cheat-sheet
  2. Python Tutorials Point
  3. Matplotlib Tutorial
  4. Matrix Manipulation Cheat-sheet
  5. Ipython Notebook
  6. Beaker Notebook
  7. yhat Rodeo

Ресурсы и Книги

  1. James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
  2. Bishop — Pattern Recognition and Machine Learning (первые главы)
  3. MachineLearning.ru
  4. Kaggle
  5. UCI Repo
  6. Visual Intro to ML

Онлайн Курсы

  1. Andrew Ng's Course
  2. Introduction to ML
  3. Learning Data Science with Python
  4. Курс от ВШЭ
  5. Обзор МООС Курсов

Временные ряды

  1. https://datamarket.com/data/list/?q=cat:edb interval:month provider:tsdl
  2. http://sophist.hse.ru/hse/nindex.shtml
  3. https://stat.yandex.ru/
  4. https://www.quandl.com/browse?idx=database-browser_economic-data.