Современные методы машинного обучения (курс майнора) — различия между версиями
Aumnov (обсуждение | вклад) (→Экзамен) |
|||
(не показано 57 промежуточных версии 7 участников) | |||
Строка 1: | Строка 1: | ||
== О курсе == | == О курсе == | ||
+ | |||
+ | === Программа === | ||
+ | |||
+ | Официальная программа появится после ее утверждения. Пока можно посмотреть [https://docs.google.com/document/d/1uMhS8SMqsZLtaOib-2OVvgG1K3wnBfkhLFqBh_78N5c/edit?usp=sharing черновик]. | ||
=== Оценка за курс === | === Оценка за курс === | ||
Строка 23: | Строка 27: | ||
=== Обратная связь === | === Обратная связь === | ||
− | По вопросам касательно лекций можете писать на alexeyum@gmail.com, добавляя строку "[Майнор ИАД]" в заголовок письма. | + | По вопросам касательно лекций можете писать на alexeyum@gmail.com (первый модуль) или riabenko.e@gmail.com (второй модуль), добавляя строку "[Майнор ИАД]" в заголовок письма. |
По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23 | По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23 | ||
+ | |||
+ | Вопросы по материалу можно обсуждать тут: http://piazza.com/hse.ru/fall2016/da3 | ||
+ | |||
+ | По административным вопросам обращайтесь к Ивановой Оксане Анатольевне, oksanaivanova@hse.ru | ||
+ | |||
+ | === Семинарские группы === | ||
+ | |||
+ | [https://www.dropbox.com/s/bjqu2de2dpuajvn/%D0%A1%D0%BF%D0%B8%D1%81%D0%BA%D0%B8%20%D0%B3%D1%80%D1%83%D0%BF%D0%BF.xlsx?dl=0 Списки групп] | ||
+ | |||
+ | '''В связи с тем, что уже прошло больше месяца с начала года, переводы между группами больше делаться не будут.''' | ||
== Учебный процесс == | == Учебный процесс == | ||
Строка 33: | Строка 47: | ||
====1 модуль==== | ====1 модуль==== | ||
− | + | Лекция 1 (1 сентября, сдвоенная). Метод опорных векторов, ядра. [https://www.dropbox.com/s/z38prt1q94qf2wa/lecture-1-kernels.pdf?dl=0 Слайды.] | |
+ | Лекция 2 (15 сентября). Методы оптимизации. [https://www.dropbox.com/s/1qd8q8nnddeig8s/lecture-2-gradient.pdf?dl=0 Слайды.] | ||
+ | Лекция 3 (22 сентября). Методы обработки данных (пропуски, категориальные признаки). [https://www.dropbox.com/s/0gjbnofpwbz8lnl/lecture-3-data.pdf?dl=0 Слайды.] | ||
− | + | Лекция 4 (6 октября). Бустинг. [https://www.dropbox.com/s/0mbe7hcn0e8xmzh/lecture-4-boosting.pdf?dl=0 Слайды.] | |
− | Лекция | + | Лекция 5 (13 октября) Бустинг (продолжение). Нейронные сети (начало). [https://www.dropbox.com/s/3gvftbheyq5mhvm/lecture-5-boosting-ann.pdf?dl=0 Слайды.] |
− | Лекция 4. | + | Лекция 6 (20 октября, сдвоенная). Консультация перед коллоквиумом (1 пара). Нейронные сети, продолжение (4 пара). [https://www.dropbox.com/s/h4quxr7fzxhdqkk/lecture-6-ann-learning.pdf?dl=0 Слайды]. |
− | + | ==== 2 модуль ==== | |
− | Лекция | + | Лекция 1 (10 ноября). Распределения и статистики. [https://yadi.sk/d/VmbkklLcyLeTc Слайды] |
− | Лекция | + | Лекция 2 (17 ноября). Проверка гипотез. [https://yadi.sk/i/ypusp4wLypjQK Слайды] |
− | Лекция | + | Лекция 3 (24 ноября). Анализ зависимостей. [https://yadi.sk/d/CcqWXhNWzJKGX Слайды] |
− | + | Лекция 4 (1 декабря). Регрессия. [https://yadi.sk/d/u4-nuizm32VQfP Слайды] | |
− | ( | + | Лекция 5 (8 декабря). Прогнозирование временных рядов. [https://yadi.sk/d/zhsPRlsh32VQnf Слайды] |
− | === Домашние | + | === Коллоквиум === |
+ | |||
+ | Программа коллоквиума: https://docs.google.com/document/d/1bheHxPvyjNRUXzohD7gx4bfbT4yx_d7kqIxCYNxZ7PQ/edit | ||
+ | |||
+ | Коллоквиум пройдет в начале 3 ноября в аудитории 3231. Расписание по группам: | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Группы !! Время | ||
+ | |- | ||
+ | | ИАД-1, ИАД-2, ИАД-3 || 10:30 | ||
+ | |- | ||
+ | | ИАД-6, ИАД-7, ИАД-8 || 12:30 | ||
+ | |- | ||
+ | | ИАД-4, ИАД-5 || 14:30 | ||
+ | |} | ||
+ | |||
+ | [https://docs.google.com/spreadsheets/d/1d1ntWx7FrzTPRCoGYdVezRfQwlyA5AMk598UG2gjfqk/edit?usp=sharing Оценки за коллоквиум.] | ||
+ | |||
+ | === Домашние задания === | ||
+ | # ДЗ 1. SVM и ядра. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов. | ||
+ | # ДЗ 2. Предобработка данных и бустинг. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов. | ||
+ | # ДЗ 3. [[Современные методы машинного обучения (курс майнора)/ДЗ3|Центральная предельная теорема]]. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов. | ||
+ | # ДЗ 4. [[Современные методы машинного обучения (курс майнора)/ДЗ4|Анализ эффективности удержания]]. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов. | ||
+ | # ДЗ 5. [[Современные методы машинного обучения (курс майнора)/ДЗ5|Прогнозирование временного ряда]]. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов. | ||
+ | |||
+ | === Соревнование === | ||
+ | |||
+ | [https://kaggle.com/join/8qoUDtE07A Ссылка]. | ||
+ | |||
+ | При регистрации в соревнование указывайте свое имя и фамилию в качестве названия команды (команды в соревновании условны и состоят из одного человека). | ||
+ | |||
+ | После окончания соревнования для получения оценки необходимо будет прислать семинаристу тетрадку, которая использует данные обучения и признаки тестовых объектов, и генерирует ответ, который был отправлен в соревнование. Тетрадку нужно прислать до 23:59 16.11. | ||
+ | |||
+ | Оценка за соревнование выставляется в соответствии с бейзлайнами, которые вы обошли. Соревнование учитывается как одно домашнее задание. | ||
+ | |||
+ | Также топ-5 участников получат в качестве бонуса увеличение накопленной оценки: 1 место получает +1 балл, 2 место - +0.8 балла, 3 место - +0.6 балла, 4 место - +0.4 балла, 5 место - +0.2 балла. | ||
=== Страницы групп === | === Страницы групп === | ||
− | * ИАД1 | + | |
− | * ИАД2 | + | * [[Современные методы машинного обучения (курс майнора) ИАД1-5|ИАД1]] |
− | * ИАД3 | + | * [[Современные методы машинного обучения (курс майнора) ИАД2-6|ИАД2]] |
+ | * [[Современные методы машинного обучения (курс майнора) ИАД3-7|ИАД3]] | ||
* [[Современные_методы_машинного_обучения_(курс_майнора)_ИАД4 | ИАД4]] | * [[Современные_методы_машинного_обучения_(курс_майнора)_ИАД4 | ИАД4]] | ||
− | * ИАД5 | + | * [[Современные методы машинного обучения (курс майнора) ИАД1-5|ИАД5]] |
− | * ИАД6 | + | * [[Современные методы машинного обучения (курс майнора) ИАД2-6|ИАД6]] |
− | * ИАД7 | + | * [[Современные_методы_машинного_обучения_(курс_майнора)/ИАД-7|ИАД7]] |
* [[Современные_методы_машинного_обучения_(курс_майнора)/ИАД-8 | ИАД8]] | * [[Современные_методы_машинного_обучения_(курс_майнора)/ИАД-8 | ИАД8]] | ||
+ | |||
+ | === Экзамен === | ||
+ | |||
+ | Экзамен пройдет 22 декабря в аудиториях 5406, 5407, 5408. Аудитория общего сбора - 5406. | ||
+ | |||
+ | Приходить необходимо в соответствии с расписанием: | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Время !! Группы | ||
+ | |- | ||
+ | | 10:30 || ИАД-5, ИАД-7 | ||
+ | |- | ||
+ | | 12:00 || ИАД-4, ИАД-6 | ||
+ | |- | ||
+ | | 14:30 || ИАД-1, ИАД-3 | ||
+ | |- | ||
+ | | 16:00 || ИАД-2, ИАД-8 | ||
+ | |} | ||
+ | |||
+ | Программа экзамена: | ||
+ | |||
+ | https://docs.google.com/document/d/1tqM0mCIVQUv1X4cQ9GnGR4Pw2-IZrRhoNnZ3FLSNK-I/edit?usp=sharing | ||
+ | |||
+ | Ведомость: | ||
+ | |||
+ | https://docs.google.com/spreadsheets/d/1JpyLcn0M1uQ-JWBh7EwOBqZwOuSiOduCUUdcEizuZH4/edit?usp=sharing | ||
== Материалы == | == Материалы == | ||
+ | |||
+ | В конце слайдов каждой лекции есть небольшая подборка материалов по теме лекции. Ниже приведен набор материалов, охватывающих многие темы. | ||
+ | |||
+ | === Книги === | ||
+ | |||
+ | * Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014. | ||
+ | * Bishop C.M. Pattern Recognition and Machine Learning. Springer, 2006. [http://www.springer.com/br/book/9780387310732 первые главы] | ||
+ | * [http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Sixth%20Printing.pdf James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning] | ||
+ | |||
+ | === Ресурсы === | ||
+ | |||
+ | * [http://www.machinelearning.ru/wiki/index.php?title=%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0 MachineLearning.ru] |
Текущая версия на 09:17, 22 декабря 2016
Содержание
О курсе
Программа
Официальная программа появится после ее утверждения. Пока можно посмотреть черновик.
Оценка за курс
Оценка за курс складывается из:
- Домашние работы (в том числе соревнования).
- Проверочные работы на семинарах.
- Аудиторная работа.
- Коллоквиум в конце 1 модуля.
- Экзамен.
Оценка вычисляется по следующим формулам:
ИТОГ = 0.7 * НАКОПЛЕННАЯ + 0.3 * ЭКЗАМЕН
НАКОПЛЕННАЯ = 0.15 * ПРОВЕРОЧНЫЕ + 0.15 * АУДИТОРНАЯ + 0.5 * ДЗ + 0.2 * КОЛЛОКВИУМ.
Также накопленная оценка может быть повышена за получение призовых мест на соревновании.
На усмотрение семинариста и лектора могут выставляться автоматы (при условии отличной накопленной оценки).
Обратная связь
По вопросам касательно лекций можете писать на alexeyum@gmail.com (первый модуль) или riabenko.e@gmail.com (второй модуль), добавляя строку "[Майнор ИАД]" в заголовок письма.
По этой ссылке можно оставить анонимный отзыв или предложение для курса: https://goo.gl/forms/JJEqdPLfikko3Na23
Вопросы по материалу можно обсуждать тут: http://piazza.com/hse.ru/fall2016/da3
По административным вопросам обращайтесь к Ивановой Оксане Анатольевне, oksanaivanova@hse.ru
Семинарские группы
В связи с тем, что уже прошло больше месяца с начала года, переводы между группами больше делаться не будут.
Учебный процесс
Лекции
1 модуль
Лекция 1 (1 сентября, сдвоенная). Метод опорных векторов, ядра. Слайды.
Лекция 2 (15 сентября). Методы оптимизации. Слайды.
Лекция 3 (22 сентября). Методы обработки данных (пропуски, категориальные признаки). Слайды.
Лекция 4 (6 октября). Бустинг. Слайды.
Лекция 5 (13 октября) Бустинг (продолжение). Нейронные сети (начало). Слайды.
Лекция 6 (20 октября, сдвоенная). Консультация перед коллоквиумом (1 пара). Нейронные сети, продолжение (4 пара). Слайды.
2 модуль
Лекция 1 (10 ноября). Распределения и статистики. Слайды
Лекция 2 (17 ноября). Проверка гипотез. Слайды
Лекция 3 (24 ноября). Анализ зависимостей. Слайды
Лекция 4 (1 декабря). Регрессия. Слайды
Лекция 5 (8 декабря). Прогнозирование временных рядов. Слайды
Коллоквиум
Программа коллоквиума: https://docs.google.com/document/d/1bheHxPvyjNRUXzohD7gx4bfbT4yx_d7kqIxCYNxZ7PQ/edit
Коллоквиум пройдет в начале 3 ноября в аудитории 3231. Расписание по группам:
Группы | Время |
---|---|
ИАД-1, ИАД-2, ИАД-3 | 10:30 |
ИАД-6, ИАД-7, ИАД-8 | 12:30 |
ИАД-4, ИАД-5 | 14:30 |
Домашние задания
- ДЗ 1. SVM и ядра. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 2. Предобработка данных и бустинг. Даты сдачи и условия смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 3. Центральная предельная теорема. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 4. Анализ эффективности удержания. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
- ДЗ 5. Прогнозирование временного ряда. Даты сдачи смотрите на странице группы или уточняйте у своих семинаристов.
Соревнование
При регистрации в соревнование указывайте свое имя и фамилию в качестве названия команды (команды в соревновании условны и состоят из одного человека).
После окончания соревнования для получения оценки необходимо будет прислать семинаристу тетрадку, которая использует данные обучения и признаки тестовых объектов, и генерирует ответ, который был отправлен в соревнование. Тетрадку нужно прислать до 23:59 16.11.
Оценка за соревнование выставляется в соответствии с бейзлайнами, которые вы обошли. Соревнование учитывается как одно домашнее задание.
Также топ-5 участников получат в качестве бонуса увеличение накопленной оценки: 1 место получает +1 балл, 2 место - +0.8 балла, 3 место - +0.6 балла, 4 место - +0.4 балла, 5 место - +0.2 балла.
Страницы групп
Экзамен
Экзамен пройдет 22 декабря в аудиториях 5406, 5407, 5408. Аудитория общего сбора - 5406.
Приходить необходимо в соответствии с расписанием:
Время | Группы |
---|---|
10:30 | ИАД-5, ИАД-7 |
12:00 | ИАД-4, ИАД-6 |
14:30 | ИАД-1, ИАД-3 |
16:00 | ИАД-2, ИАД-8 |
Программа экзамена:
https://docs.google.com/document/d/1tqM0mCIVQUv1X4cQ9GnGR4Pw2-IZrRhoNnZ3FLSNK-I/edit?usp=sharing
Ведомость:
https://docs.google.com/spreadsheets/d/1JpyLcn0M1uQ-JWBh7EwOBqZwOuSiOduCUUdcEizuZH4/edit?usp=sharing
Материалы
В конце слайдов каждой лекции есть небольшая подборка материалов по теме лекции. Ниже приведен набор материалов, охватывающих многие темы.
Книги
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Bishop C.M. Pattern Recognition and Machine Learning. Springer, 2006. первые главы
- James, Witten, Hastie, Tibshirani — An Introduction to Statistical Learning