Современные методы машинного обучения (курс майнора) 2017/2018 ИАД1 — различия между версиями
Panov.ai (обсуждение | вклад) (Новая страница: «__TOC__ == Майнор по курсу "Современные методы машинного обучения" - 2017/2018 учебный год - ИАД-1 и…») |
Panov.ai (обсуждение | вклад) |
||
(не показаны 33 промежуточные версии этого же участника) | |||
Строка 1: | Строка 1: | ||
__TOC__ | __TOC__ | ||
− | == Майнор по курсу | + | == Майнор по курсу СММО - 2017/2018 учебный год - ИАД-1 и ИАД-2== |
На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2 | На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2 | ||
Строка 6: | Строка 6: | ||
Семинарист: [[Участник:Panov.ai | Панов Александр]] [mailto:apanov@hse.ru] <br/> | Семинарист: [[Участник:Panov.ai | Панов Александр]] [mailto:apanov@hse.ru] <br/> | ||
При обращении по почте, начинайте тему письма со слов ''[Майнор ИАД]'' | При обращении по почте, начинайте тему письма со слов ''[Майнор ИАД]'' | ||
+ | |||
+ | '''UPDATE!''' Вопросы по ДЗ нужно и можно задавать ассистентам групп: <br/> | ||
+ | 1) ИАД-1 - [http://t.me/msgolovina Мария Головина] (Telegram @msgolovina), <br/> | ||
+ | 2) ИАД-2 - [http://t.me/skripniuk Владислав Скрипнюк] (Telegram @skripniuk). <br/> | ||
''' [http://wiki.cs.hse.ru/Современные_методы_машинного_обучения_(курс_майнора)_2017/2018 Страница] курса''' <br/> | ''' [http://wiki.cs.hse.ru/Современные_методы_машинного_обучения_(курс_майнора)_2017/2018 Страница] курса''' <br/> | ||
− | '''Анонимные''' комментарии, замечания и пожелания можно оставить [https://goo.gl/forms/eyYRTv379a9mj7Tr2 здесь]<br/>. | + | '''Анонимные''' комментарии, замечания и пожелания можно оставить [https://goo.gl/forms/eyYRTv379a9mj7Tr2 здесь]<br/> |
+ | Репозиторий курса - [https://github.com/grafft/hse-tasks/tree/master/minor-aml-17 https://github.com/grafft/hse-tasks/tree/master/minor-aml-17]<br/> | ||
− | + | '''ИТОГОВЫЕ оценки''' смотрите в [https://docs.google.com/spreadsheets/d/1ly3c1qjaDDOYW-u7za1Gqm_EYRM6qUjnF0ARjvaT570 таблице курса]. Зеленые - автомат, желтые - на экзамен, красные - таких не знаем. | |
− | ''' | + | |
+ | == Семинары == | ||
+ | '''1) 7 сентября 2017:''' Метод опорных векторов и ядра - [http://nbviewer.jupyter.org/github/grafft/hse-tasks/blob/master/minor-aml-17/seminar1/1_svm.ipynb тетрадка], [https://goo.gl/forms/1byeOJg3la09woPe2 опрос] <br/> | ||
+ | '''2) 21 сентября 2017:''' Методы оптимизации - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar2/2_gradient_descent.ipynb тетрадка], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar2/food_trucks.txt данные1], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar2/space_ga.txt данные2], [https://goo.gl/forms/aBxtq6Gg5ameNlpr1 опрос] <br/> | ||
+ | '''3) 28 сентября 2017:''' Предобработка данных - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar3/3_missing.ipynb тетрадка], [https://goo.gl/forms/LU2QtGA4bDFUdo8z1 опрос] <br/> | ||
+ | '''4) 5 октября 2017:''' Бустинг - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar4/4_boosting_adv.ipynb основная], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar4/xgboost_test.ipynb дополнительная], опрос <br/> | ||
+ | '''5) 12 октября 2017:''' Нейронные сети: начало - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar5/5_mlp.ipynb тетрадка MLP], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar5/5_tf_mlp.ipynb тетрадка TF], [https://goo.gl/forms/TJ7w62qnyuT3nLMz2 опрос] <br/> | ||
+ | '''6) 19 октября 2017:''' Нейронные сети: продолжение- [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar5/5_tf_conv.ipynb тетрадка TF conv], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar6/6_keras_start.ipynb тетрадка Keras], [https://goo.gl/forms/LcXXb0VYvGJAzJec2 опрос] <br/> | ||
+ | '''7) 2 ноября 2017:''' Статисткиа: распределения - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar7/7_stat_distr.ipynb тетрадка 1], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar7/7_stat_select.ipynb тетрадка 2]<br/> | ||
+ | '''8) 9 ноября 2017:''' Статистика: критерии - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar8 папка с тетрадками], [https://goo.gl/forms/q6NOfABn8EquAnxc2 опрос] <br/> | ||
+ | '''9) 16 ноября 2017:''' Нейронные сети: рекуррентные - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar9 папка с тетрадками], [https://goo.gl/forms/q6NOfABn8EquAnxc2 опрос] <br/> | ||
+ | '''10) 23 ноября 2017:''' Статистика: гипотезы и корреляции - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar10 папка с тетрадками], опрос<br/> | ||
+ | '''11) 7 декабря 2017:''' Статистика: временные ряды - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar11 папка с тетрадкой и данными]<br/> | ||
+ | '''12) 14 декабря 2017:''' Статистика: регрессия - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/seminar12 папка с тетрадкой и данными]<br/> | ||
== Домашние Задания == | == Домашние Задания == | ||
− | + | '''1) ДЗ 1: SVM''' - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw1/hw1-svm.ipynb тетрадка], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw1/data.zip данные1], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw1/titanium.csv данные2]. Готовые решения (только файл ipynb!) отправлять в [https://www.dropbox.com/request/CuFAJ5bY0y7LCzqyYkc1 Dropbox] с названием файла '''IDA<Номер группы>HW1<Фамилия>.ipynb''' - например IDA1HW1Panov.ipynb. Срок - 9 октября 2017, 23:59. <br/> | |
+ | '''2) ДЗ 2: Бустинг''' - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw2/hw2.ipynb тетрадка], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw2/data.zip данные], [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw2/paper.pdf статья]. Готовые решения (только файл ipynb!) отправлять в [https://www.dropbox.com/request/sc22z368B3GSxxudlSRb Dropbox] с названием файла '''IDA<Номер группы>HW2<Фамилия>.ipynb''' - например IDA1HW2Panov.ipynb. Срок - 22 октября 2017, 23:59. <br/> | ||
+ | '''3) ДЗ 3: Нейросети''' - [https://github.com/grafft/hse-tasks/blob/master/minor-aml-17/hw3/hw3.ipynb тетрадка], [https://www.dropbox.com/s/y62of919dlasyzs/images.npy?dl=0 данные]. Готовые решения (только файл ipynb!) отправлять в [https://www.dropbox.com/request/ZpCjSqeP4f8dOyByqgSb Dropbox] с названием файла '''IDA<Номер группы>HW3<Фамилия>.ipynb''' - например IDA1HW3Panov.ipynb. Срок - 3 декабря 2017, 23:59. <br/> | ||
+ | '''3) ДЗ 4: Статистика'''. Задание: выбрать любой временной ряд, который вы будете прогнозировать; лучше взять ряд с месячным или квартальным разрешением, длиной от 100 отсчётов и не слишком простой (не выглядящий как константа или другая простая функция), иначе вам будет скучно его прогнозировать; внести выбранный ряд в [https://docs.google.com/spreadsheets/d/1NXTSQfIkAAHHnslrOVb2e0syP3Q3SHz0oZ_7qVor5Lg/edit#gid=0 таблицу], убедившись, что никто другой его не взял - если несколько студентов будут прогнозировать один и тот же ряд, задача не будет засчитана никому из них; проанализировать выбранный ряд по аналогии с примером, разбиравшимся на семинаре, и построить его прогноз на 3 года вперёд с помощью модели класса ARIMA. Если вы не знаете, где можно брать ряды, смотрите источнике ниже - в разделе "Полезные ссылки". Готовые решения (только файл ipynb! со ссылкой на ряд) отправлять в [https://www.dropbox.com/request/Gdn1yrYOEdIHxgkZLpSB Dropbox] с названием файла '''IDA<Номер группы>HW4<Фамилия>.ipynb''' - например IDA1HW4Panov.ipynb. Срок - 14 декабря 2017, 23:59. | ||
== Полезные ссылки (Будут пополняться) == | == Полезные ссылки (Будут пополняться) == | ||
Строка 22: | Строка 42: | ||
# [http://crsouza.com/2010/03/17/kernel-functions-for-machine-learning-applications/ Описание ядер] | # [http://crsouza.com/2010/03/17/kernel-functions-for-machine-learning-applications/ Описание ядер] | ||
# [http://www.ccas.ru/voron/download/SVM.pdf Еще про SVM] | # [http://www.ccas.ru/voron/download/SVM.pdf Еще про SVM] | ||
+ | |||
+ | ''Полезные визуализации'' | ||
+ | # [http://colah.github.io/] Нейросети, распределения и т.п. | ||
'' Pandas & Seaborn '' | '' Pandas & Seaborn '' | ||
Строка 63: | Строка 86: | ||
# [https://www.coursera.org/learn/introduction-machine-learning Курс от ВШЭ] | # [https://www.coursera.org/learn/introduction-machine-learning Курс от ВШЭ] | ||
# [http://habrahabr.ru/post/248069/ Обзор МООС Курсов] | # [http://habrahabr.ru/post/248069/ Обзор МООС Курсов] | ||
+ | |||
+ | '''Временные ряды''' | ||
+ | # https://datamarket.com/data/list/?q=cat:edb interval:month provider:tsdl | ||
+ | # http://sophist.hse.ru/hse/nindex.shtml | ||
+ | # https://stat.yandex.ru/ | ||
+ | # https://www.quandl.com/browse?idx=database-browser_economic-data. |
Текущая версия на 11:51, 18 декабря 2017
Содержание
Майнор по курсу СММО - 2017/2018 учебный год - ИАД-1 и ИАД-2
На данной странице будут вывешиваться последние новости и материалы для семинарских занятий групп ИАД-1 и ИАД-2
Семинарист: Панов Александр [1]
При обращении по почте, начинайте тему письма со слов [Майнор ИАД]
UPDATE! Вопросы по ДЗ нужно и можно задавать ассистентам групп:
1) ИАД-1 - Мария Головина (Telegram @msgolovina),
2) ИАД-2 - Владислав Скрипнюк (Telegram @skripniuk).
Страница курса
Анонимные комментарии, замечания и пожелания можно оставить здесь
Репозиторий курса - https://github.com/grafft/hse-tasks/tree/master/minor-aml-17
ИТОГОВЫЕ оценки смотрите в таблице курса. Зеленые - автомат, желтые - на экзамен, красные - таких не знаем.
Семинары
1) 7 сентября 2017: Метод опорных векторов и ядра - тетрадка, опрос
2) 21 сентября 2017: Методы оптимизации - тетрадка, данные1, данные2, опрос
3) 28 сентября 2017: Предобработка данных - тетрадка, опрос
4) 5 октября 2017: Бустинг - основная, дополнительная, опрос
5) 12 октября 2017: Нейронные сети: начало - тетрадка MLP, тетрадка TF, опрос
6) 19 октября 2017: Нейронные сети: продолжение- тетрадка TF conv, тетрадка Keras, опрос
7) 2 ноября 2017: Статисткиа: распределения - тетрадка 1, тетрадка 2
8) 9 ноября 2017: Статистика: критерии - папка с тетрадками, опрос
9) 16 ноября 2017: Нейронные сети: рекуррентные - папка с тетрадками, опрос
10) 23 ноября 2017: Статистика: гипотезы и корреляции - папка с тетрадками, опрос
11) 7 декабря 2017: Статистика: временные ряды - папка с тетрадкой и данными
12) 14 декабря 2017: Статистика: регрессия - папка с тетрадкой и данными
Домашние Задания
1) ДЗ 1: SVM - тетрадка, данные1, данные2. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW1<Фамилия>.ipynb - например IDA1HW1Panov.ipynb. Срок - 9 октября 2017, 23:59.
2) ДЗ 2: Бустинг - тетрадка, данные, статья. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW2<Фамилия>.ipynb - например IDA1HW2Panov.ipynb. Срок - 22 октября 2017, 23:59.
3) ДЗ 3: Нейросети - тетрадка, данные. Готовые решения (только файл ipynb!) отправлять в Dropbox с названием файла IDA<Номер группы>HW3<Фамилия>.ipynb - например IDA1HW3Panov.ipynb. Срок - 3 декабря 2017, 23:59.
3) ДЗ 4: Статистика. Задание: выбрать любой временной ряд, который вы будете прогнозировать; лучше взять ряд с месячным или квартальным разрешением, длиной от 100 отсчётов и не слишком простой (не выглядящий как константа или другая простая функция), иначе вам будет скучно его прогнозировать; внести выбранный ряд в таблицу, убедившись, что никто другой его не взял - если несколько студентов будут прогнозировать один и тот же ряд, задача не будет засчитана никому из них; проанализировать выбранный ряд по аналогии с примером, разбиравшимся на семинаре, и построить его прогноз на 3 года вперёд с помощью модели класса ARIMA. Если вы не знаете, где можно брать ряды, смотрите источнике ниже - в разделе "Полезные ссылки". Готовые решения (только файл ipynb! со ссылкой на ряд) отправлять в Dropbox с названием файла IDA<Номер группы>HW4<Фамилия>.ipynb - например IDA1HW4Panov.ipynb. Срок - 14 декабря 2017, 23:59.
Полезные ссылки (Будут пополняться)
Семинар 1
Полезные визуализации
- [2] Нейросети, распределения и т.п.
Pandas & Seaborn
Наборы данных
FYI
Python
- PEP-8 Code Style Guide Cheat-sheet
- Python Tutorials Point
- Matplotlib Tutorial
- Matrix Manipulation Cheat-sheet
- Ipython Notebook
- Beaker Notebook
- yhat Rodeo
Ресурсы и Книги
- James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning
- Bishop — Pattern Recognition and Machine Learning (первые главы)
- MachineLearning.ru
- Kaggle
- UCI Repo
- Visual Intro to ML
Онлайн Курсы
- Andrew Ng's Course
- Introduction to ML
- Learning Data Science with Python
- Курс от ВШЭ
- Обзор МООС Курсов
Временные ряды