Современные методы машинного обучения (курс майнора) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Экзамен)
 
(не показано 58 промежуточных версии 7 участников)
Строка 1: Строка 1:
 
== О курсе ==
 
== О курсе ==
 +
 +
=== Программа ===
 +
 +
Официальная программа появится после ее утверждения. Пока можно посмотреть [https://docs.google.com/document/d/1uMhS8SMqsZLtaOib-2OVvgG1K3wnBfkhLFqBh_78N5c/edit?usp=sharing черновик].
  
 
=== Оценка за курс ===
 
=== Оценка за курс ===
Строка 23: Строка 27:
 
=== Обратная связь ===
 
=== Обратная связь ===
  
По вопросам касательно лекций можете писать на alexeyum@gmail.com, добавляя строку "[Майнор ИАД]" в заголовок письма.
+
По вопросам касательно лекций можете писать на alexeyum@gmail.com (первый модуль) или riabenko.e@gmail.com (второй модуль), добавляя строку "[Майнор ИАД]" в заголовок письма.
  
 
По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23
 
По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23
 +
 +
Вопросы по материалу можно обсуждать тут: http://piazza.com/hse.ru/fall2016/da3
 +
 +
По административным вопросам обращайтесь к Ивановой Оксане Анатольевне, oksanaivanova@hse.ru
 +
 +
=== Семинарские группы ===
 +
 +
[https://www.dropbox.com/s/bjqu2de2dpuajvn/%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8%20%D0%B3%D1%80%D1%83%D0%BF%D0%BF.xlsx?dl=0 Списки групп]
 +
 +
'''В связи с тем, что уже прошло больше месяца с начала года, переводы между группами больше делаться не будут.'''
  
 
== Учебный процесс ==
 
== Учебный процесс ==
Строка 33: Строка 47:
 
====1 модуль====
 
====1 модуль====
  
Лекции 1 и 2 (1 сентября). Метод опорных векторов, ядра. [https://www.dropbox.com/s/z38prt1q94qf2wa/lecture-1-kernels.pdf?dl=0 Слайды.]
+
Лекция 1 (1 сентября, сдвоенная). Метод опорных векторов, ядра. [https://www.dropbox.com/s/z38prt1q94qf2wa/lecture-1-kernels.pdf?dl=0 Слайды.]
  
 +
Лекция 2 (15 сентября). Методы оптимизации. [https://www.dropbox.com/s/1qd8q8nnddeig8s/lecture-2-gradient.pdf?dl=0 Слайды.]
  
 +
Лекция 3 (22 сентября). Методы обработки данных (пропуски, категориальные признаки). [https://www.dropbox.com/s/0gjbnofpwbz8lnl/lecture-3-data.pdf?dl=0 Слайды.]
  
''(Планируемые)''
+
Лекция 4 (6 октября). Бустинг. [https://www.dropbox.com/s/0mbe7hcn0e8xmzh/lecture-4-boosting.pdf?dl=0 Слайды.]
  
Лекция 3 (15 сентября). Методы оптимизации.
+
Лекция 5 (13 октября) Бустинг (продолжение). Нейронные сети (начало). [https://www.dropbox.com/s/3gvftbheyq5mhvm/lecture-5-boosting-ann.pdf?dl=0 Слайды.]
  
Лекция 4. Методы обработки данных.
+
Лекция 6 (20 октября, сдвоенная). Консультация перед коллоквиумом (1 пара). Нейронные сети, продолжение (4 пара). [https://www.dropbox.com/s/h4quxr7fzxhdqkk/lecture-6-ann-learning.pdf?dl=0 Слайды].
  
Лекция 5. Бустинг.
+
==== 2 модуль ====
  
Лекция 6. Матричные разложения.
+
Лекция 1 (10 ноября). Распределения и статистики. [https://yadi.sk/d/VmbkklLcyLeTc Слайды]
  
Лекция 7. Нейронные сети.
+
Лекция 2 (17 ноября). Проверка гипотез. [https://yadi.sk/i/ypusp4wLypjQK Слайды]
  
Лекция 8. Продвинутые методы кластеризации.
+
Лекция 3 (24 ноября). Анализ зависимостей. [https://yadi.sk/d/CcqWXhNWzJKGX Слайды]
  
==== 2 модуль ====
+
Лекция 4 (1 декабря). Регрессия. [https://yadi.sk/d/u4-nuizm32VQfP Слайды]
  
(Будет объявлено позже)
+
Лекция 5 (8 декабря). Прогнозирование временных рядов. [https://yadi.sk/d/zhsPRlsh32VQnf Слайды]
  
=== Домашние работы ===
+
=== Коллоквиум ===
 +
 
 +
Программа коллоквиума: https://docs.google.com/document/d/1bheHxPvyjNRUXzohD7gx4bfbT4yx_d7kqIxCYNxZ7PQ/edit
 +
 
 +
Коллоквиум пройдет в начале 3 ноября в аудитории 3231. Расписание по группам:
 +
 
 +
{| class="wikitable"
 +
|-
 +
! Группы !! Время
 +
|-
 +
| ИАД-1, ИАД-2, ИАД-3 || 10:30
 +
|-
 +
| ИАД-6, ИАД-7, ИАД-8 || 12:30
 +
|-
 +
| ИАД-4, ИАД-5  || 14:30
 +
|}
 +
 
 +
[https://docs.google.com/spreadsheets/d/1d1ntWx7FrzTPRCoGYdVezRfQwlyA5AMk598UG2gjfqk/edit?usp=sharing Оценки за коллоквиум.]
 +
 
 +
=== Домашние задания ===
 +
# ДЗ 1. SVM и ядра. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
 +
# ДЗ 2. Предобработка данных и бустинг. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
 +
# ДЗ 3. [[Современные методы машинного обучения (курс майнора)/ДЗ3|Центральная предельная теорема]]. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
 +
# ДЗ 4. [[Современные методы машинного обучения (курс майнора)/ДЗ4|Анализ эффективности удержания]]. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
 +
# ДЗ 5. [[Современные методы машинного обучения (курс майнора)/ДЗ5|Прогнозирование временного ряда]]. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
 +
 
 +
=== Соревнование ===
 +
 
 +
[https://kaggle.com/join/8qoUDtE07A Ссылка].
 +
 
 +
При регистрации в соревнование указывайте свое имя и фамилию в качестве названия команды (команды в соревновании условны и состоят из одного человека).
 +
 
 +
После окончания соревнования для получения оценки необходимо будет прислать семинаристу тетрадку, которая использует данные обучения и признаки тестовых объектов, и генерирует ответ, который был отправлен в соревнование. Тетрадку нужно прислать до 23:59 16.11.
 +
 
 +
Оценка за соревнование выставляется в соответствии с бейзлайнами, которые вы обошли. Соревнование учитывается как одно домашнее задание.
 +
 
 +
Также топ-5 участников получат в качестве бонуса увеличение накопленной оценки: 1 место получает +1 балл, 2 место - +0.8 балла, 3 место - +0.6 балла, 4 место - +0.4 балла, 5 место - +0.2 балла.
  
 
=== Страницы групп ===
 
=== Страницы групп ===
* ИАД1
+
 
* ИАД2
+
* [[Современные методы машинного обучения (курс майнора) ИАД1-5|ИАД1]]
* ИАД3
+
* [[Современные методы машинного обучения (курс майнора) ИАД2-6|ИАД2]]
 +
* [[Современные методы машинного обучения (курс майнора) ИАД3-7|ИАД3]]
 
* [[Современные_методы_машинного_обучения_(курс_майнора)_ИАД4 | ИАД4]]
 
* [[Современные_методы_машинного_обучения_(курс_майнора)_ИАД4 | ИАД4]]
* ИАД5
+
* [[Современные методы машинного обучения (курс майнора) ИАД1-5|ИАД5]]
* ИАД6
+
* [[Современные методы машинного обучения (курс майнора) ИАД2-6|ИАД6]]
* ИАД7
+
* [[Современные_методы_машинного_обучения_(курс_майнора)/ИАД-7|ИАД7]]
* ИАД8
+
* [[Современные_методы_машинного_обучения_(курс_майнора)/ИАД-8 | ИАД8]]
 +
 
 +
=== Экзамен ===
 +
 
 +
Экзамен пройдет 22 декабря в аудиториях 5406, 5407, 5408. Аудитория общего сбора - 5406.
 +
 
 +
Приходить необходимо в соответствии с расписанием:
 +
 
 +
{| class="wikitable"
 +
|-
 +
! Время !! Группы
 +
|-
 +
| 10:30 || ИАД-5, ИАД-7
 +
|-
 +
| 12:00 || ИАД-4, ИАД-6
 +
|-
 +
| 14:30 || ИАД-1, ИАД-3
 +
|-
 +
| 16:00 || ИАД-2, ИАД-8
 +
|}
 +
 
 +
Программа экзамена:
 +
 
 +
https://docs.google.com/document/d/1tqM0mCIVQUv1X4cQ9GnGR4Pw2-IZrRhoNnZ3FLSNK-I/edit?usp=sharing
 +
 
 +
Ведомость:
 +
 
 +
https://docs.google.com/spreadsheets/d/1JpyLcn0M1uQ-JWBh7EwOBqZwOuSiOduCUUdcEizuZH4/edit?usp=sharing
  
 
== Материалы ==
 
== Материалы ==
 +
 +
В конце слайдов каждой лекции есть небольшая подборка материалов по теме лекции. Ниже приведен набор материалов, охватывающих многие темы.
 +
 +
=== Книги ===
 +
 +
* Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
 +
* Bishop C.M. Pattern Recognition and Machine Learning. Springer, 2006. [http://www.springer.com/br/book/9780387310732 первые главы]
 +
* [http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Sixth%20Printing.pdf James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning]
 +
 +
=== Ресурсы ===
 +
 +
* [http://www.machinelearning.ru/wiki/index.php?title=%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0 MachineLearning.ru]

Текущая версия на 09:17, 22 декабря 2016

О курсе

Программа

Официальная программа появится после ее утверждения. Пока можно посмотреть черновик.

Оценка за курс

Оценка за курс складывается из:

  • Домашние работы (в том числе соревнования).
  • Проверочные работы на семинарах.
  • Аудиторная работа.
  • Коллоквиум в конце 1 модуля.
  • Экзамен.

Оценка вычисляется по следующим формулам:

ИТОГ = 0.7 * НАКОПЛЕННАЯ + 0.3 * ЭКЗАМЕН

НАКОПЛЕННАЯ = 0.15 * ПРОВЕРОЧНЫЕ + 0.15 * АУДИТОРНАЯ + 0.5 * ДЗ + 0.2 * КОЛЛОКВИУМ.

Также накопленная оценка может быть повышена за получение призовых мест на соревновании.

На усмотрение семинариста и лектора могут выставляться автоматы (при условии отличной накопленной оценки).

Обратная связь

По вопросам касательно лекций можете писать на alexeyum@gmail.com (первый модуль) или riabenko.e@gmail.com (второй модуль), добавляя строку "[Майнор ИАД]" в заголовок письма.

По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23

Вопросы по материалу можно обсуждать тут: http://piazza.com/hse.ru/fall2016/da3

По административным вопросам обращайтесь к Ивановой Оксане Анатольевне, oksanaivanova@hse.ru

Семинарские группы

Списки групп

В связи с тем, что уже прошло больше месяца с начала года, переводы между группами больше делаться не будут.

Учебный процесс

Лекции

1 модуль

Лекция 1 (1 сентября, сдвоенная). Метод опорных векторов, ядра. Слайды.

Лекция 2 (15 сентября). Методы оптимизации. Слайды.

Лекция 3 (22 сентября). Методы обработки данных (пропуски, категориальные признаки). Слайды.

Лекция 4 (6 октября). Бустинг. Слайды.

Лекция 5 (13 октября) Бустинг (продолжение). Нейронные сети (начало). Слайды.

Лекция 6 (20 октября, сдвоенная). Консультация перед коллоквиумом (1 пара). Нейронные сети, продолжение (4 пара). Слайды.

2 модуль

Лекция 1 (10 ноября). Распределения и статистики. Слайды

Лекция 2 (17 ноября). Проверка гипотез. Слайды

Лекция 3 (24 ноября). Анализ зависимостей. Слайды

Лекция 4 (1 декабря). Регрессия. Слайды

Лекция 5 (8 декабря). Прогнозирование временных рядов. Слайды

Коллоквиум

Программа коллоквиума: https://docs.google.com/document/d/1bheHxPvyjNRUXzohD7gx4bfbT4yx_d7kqIxCYNxZ7PQ/edit

Коллоквиум пройдет в начале 3 ноября в аудитории 3231. Расписание по группам:

Группы Время
ИАД-1, ИАД-2, ИАД-3 10:30
ИАД-6, ИАД-7, ИАД-8 12:30
ИАД-4, ИАД-5 14:30

Оценки за коллоквиум.

Домашние задания

  1. ДЗ 1. SVM и ядра. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
  2. ДЗ 2. Предобработка данных и бустинг. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
  3. ДЗ 3. Центральная предельная теорема. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
  4. ДЗ 4. Анализ эффективности удержания. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
  5. ДЗ 5. Прогнозирование временного ряда. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.

Соревнование

Ссылка.

При регистрации в соревнование указывайте свое имя и фамилию в качестве названия команды (команды в соревновании условны и состоят из одного человека).

После окончания соревнования для получения оценки необходимо будет прислать семинаристу тетрадку, которая использует данные обучения и признаки тестовых объектов, и генерирует ответ, который был отправлен в соревнование. Тетрадку нужно прислать до 23:59 16.11.

Оценка за соревнование выставляется в соответствии с бейзлайнами, которые вы обошли. Соревнование учитывается как одно домашнее задание.

Также топ-5 участников получат в качестве бонуса увеличение накопленной оценки: 1 место получает +1 балл, 2 место - +0.8 балла, 3 место - +0.6 балла, 4 место - +0.4 балла, 5 место - +0.2 балла.

Страницы групп

Экзамен

Экзамен пройдет 22 декабря в аудиториях 5406, 5407, 5408. Аудитория общего сбора - 5406.

Приходить необходимо в соответствии с расписанием:

Время Группы
10:30 ИАД-5, ИАД-7
12:00 ИАД-4, ИАД-6
14:30 ИАД-1, ИАД-3
16:00 ИАД-2, ИАД-8

Программа экзамена:

https://docs.google.com/document/d/1tqM0mCIVQUv1X4cQ9GnGR4Pw2-IZrRhoNnZ3FLSNK-I/edit?usp=sharing

Ведомость:

https://docs.google.com/spreadsheets/d/1JpyLcn0M1uQ-JWBh7EwOBqZwOuSiOduCUUdcEizuZH4/edit?usp=sharing

Материалы

В конце слайдов каждой лекции есть небольшая подборка материалов по теме лекции. Ниже приведен набор материалов, охватывающих многие темы.

Книги

Ресурсы