Современные методы машинного обучения (курс майнора)
Содержание
О курсе
Программа
Официальная программа появится после ее утверждения. Пока можно посмотреть черновик.
Оценка за курс
Оценка за курс складывается из:
- Домашние работы (в том числе соревнования).
- Проверочные работы на семинарах.
- Аудиторная работа.
- Коллоквиум в конце 1 модуля.
- Экзамен.
Оценка вычисляется по следующим формулам:
ИТОГ = 0.7 * НАКОПЛЕННАЯ + 0.3 * ЭКЗАМЕН
НАКОПЛЕННАЯ = 0.15 * ПРОВЕРОЧНЫЕ + 0.15 * АУДИТОРНАЯ + 0.5 * ДЗ + 0.2 * КОЛЛОКВИУМ.
Также накопленная оценка может быть повышена за получение призовых мест на соревновании.
На усмотрение семинариста и лектора могут выставляться автоматы (при условии отличной накопленной оценки).
Обратная связь
По вопросам касательно лекций можете писать на alexeyum@gmail.com (первый модуль) или riabenko.e@gmail.com (второй модуль), добавляя строку "[Майнор ИАД]" в заголовок письма.
По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23
Вопросы по материалу можно обсуждать тут: http://piazza.com/hse.ru/fall2016/da3
По административным вопросам обращайтесь к Ивановой Оксане Анатольевне, oksanaivanova@hse.ru
Семинарские группы
В связи с тем, что уже прошло больше месяца с начала года, переводы между группами больше делаться не будут.
Учебный процесс
Лекции
1 модуль
Лекция 1 (1 сентября, сдвоенная). Метод опорных векторов, ядра. Слайды.
Лекция 2 (15 сентября). Методы оптимизации. Слайды.
Лекция 3 (22 сентября). Методы обработки данных (пропуски, категориальные признаки). Слайды.
Лекция 4 (6 октября). Бустинг. Слайды.
Лекция 5 (13 октября) Бустинг (продолжение). Нейронные сети (начало). Слайды.
Лекция 6 (20 октября, сдвоенная). Консультация перед коллоквиумом (1 пара). Нейронные сети, продолжение (4 пара). Слайды.
2 модуль
Лекция 1 (10 ноября). Распределения и статистики. Слайды
Лекция 2 (17 ноября). Проверка гипотез. Слайды
Лекция 3 (24 ноября). Анализ зависимостей. Слайды
Лекция 4 (1 декабря). Регрессия. Слайды
Лекция 5 (8 декабря). Прогнозирование временных рядов. Слайды
Коллоквиум
Программа коллоквиума: https://docs.google.com/document/d/1bheHxPvyjNRUXzohD7gx4bfbT4yx_d7kqIxCYNxZ7PQ/edit
Коллоквиум пройдет в начале 3 ноября в аудитории 3231. Расписание по группам:
Группы | Время |
---|---|
ИАД-1, ИАД-2, ИАД-3 | 10:30 |
ИАД-6, ИАД-7, ИАД-8 | 12:30 |
ИАД-4, ИАД-5 | 14:30 |
Домашние задания
- ДЗ 1. SVM и ядра. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 2. Предобработка данных и бустинг. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 3. Центральная предельная теорема. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 4. Анализ эффективности удержания. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 5. Прогнозирование временного ряда. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
Соревнование
При регистрации в соревнование указывайте свое имя и фамилию в качестве названия команды (команды в соревновании условны и состоят из одного человека).
После окончания соревнования для получения оценки необходимо будет прислать семинаристу тетрадку, которая использует данные обучения и признаки тестовых объектов, и генерирует ответ, который был отправлен в соревнование. Тетрадку нужно прислать до 23:59 16.11.
Оценка за соревнование выставляется в соответствии с бейзлайнами, которые вы обошли. Соревнование учитывается как одно домашнее задание.
Также топ-5 участников получат в качестве бонуса увеличение накопленной оценки: 1 место получает +1 балл, 2 место - +0.8 балла, 3 место - +0.6 балла, 4 место - +0.4 балла, 5 место - +0.2 балла.
Страницы групп
Экзамен
Экзамен пройдет 22 декабря в аудиториях 5406, 5407, 5408. Аудитория общего сбора - 5406.
Приходить необходимо в соответствии с расписанием:
Время | Группы |
---|---|
10:30 | ИАД-5, ИАД-7 |
12:00 | ИАД-4, ИАД-6 |
14:30 | ИАД-1, ИАД-3 |
16:00 | ИАД-2, ИАД-8 |
Программа экзамена:
https://docs.google.com/document/d/1tqM0mCIVQUv1X4cQ9GnGR4Pw2-IZrRhoNnZ3FLSNK-I/edit?usp=sharing
Ведомость:
https://docs.google.com/spreadsheets/d/1JpyLcn0M1uQ-JWBh7EwOBqZwOuSiOduCUUdcEizuZH4/edit?usp=sharing
Материалы
В конце слайдов каждой лекции есть небольшая подборка материалов по теме лекции. Ниже приведен набор материалов, охватывающих многие темы.
Книги
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Bishop C.M. Pattern Recognition and Machine Learning. Springer, 2006. первые главы
- James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning