Байесовские методы машинного обучения 2019

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Лектор: Дмитрий Петрович Ветров

Семинарист: Екатерина Лобачева

Контакты: по всем вопросам, связанным с курсом, просьба писать на bayesml@gmail.com. В название письма обязательно добавлять [ФКН БММО19]. Письма без этого тега могут просто не дойти до преподавателей!

У курса есть чат в телеграме. Все объявления по курсу будут вывешиваться именно в чате! Всем студентам будет отправлена ссылка на него на почту. Преподаватели в чате бывают, но не всегда. По всем важным вопросам стоит писать на почту.

Краткое описание

Bayes.jpeg

Изучение дисциплины «Байесовские методы машинного обучения» нацелено на освоение т.н. байесовского подхода к теории вероятностей как одного из последовательных способов математических рассуждений в условиях неопределенности. В байесовском подходе вероятность интерпретируется как мера незнания, а не как объективная случайность. Простые правила оперирования с вероятностью, такие как формула полной вероятности и формула Байеса, позволяют проводить рассуждения в условиях неопределенности. В этом смысле байесовский подход к теории вероятностей можно рассматривать как обобщение классической булевой логики.

Целью курса также является освоение студентами основных способов применения байесовского подхода при решении задач машинного обучения. Байесовский подход позволяет эффективно учитывать различные предпочтения пользователя при построении решающих правил прогноза. Кроме того, он позволяет решать задачи выбора структурных параметров модели. В частности, здесь удается решать без комбинаторного перебора задачи селекции признаков, выбора числа кластеров в данных, размерности редуцированного пространства при уменьшении размерности, значений коэффициентов регуляризации и проч.

Предполагается, что в результате освоения курса студенты будут способны строить комплексные вероятностные модели, учитывающие структуру прикладной задачи машинного обучения, выводить необходимые формулы для решения задач обучения и вывода в рамках построенных вероятностных моделей, а также эффективно реализовывать данные модели на компьютере.

Новости

  • 11.09.19 - Выложена формулировка первого практического задания. Стандартный срок сдачи - 25 сентября 23:00.
  • 19.09.19 - Выложена формулировка первого теоретического задания. Стандартный срок сдачи - 3 октября 23:00.
  • 03.10.19 - Выложена формулировка второго теоретического задания. Стандартный срок сдачи - 10 октября 23:00.
  • 11.10.19 - Выложена формулировка первой лабораторной работы. Стандартный срок сдачи - 18 октября 23:00.
  • 19.10.19 - Выложена формулировка второго практического задания. Стандартный срок сдачи - 01 ноября 23:00.
  • 01.11.19 - Выложена формулировка третьего теоретического задания. Стандартный срок сдачи - 11 ноября 23:00.
  • 19.11.19 - Выложена формулировка второй лабораторной работы. Стандартный срок сдачи - 27 ноября 23:00.
  • 28.11.19 - Выложена формулировка третьей лабораторной работы. Стандартный срок сдачи - 6 декабря 23:00.
  • 06.12.19 - Выложена формулировка четвертой лабораторной работы. Стандартный срок сдачи - 13 декабря 23:00.

Отчётность по курсу и критерии оценки

В курсе предусмотрено несколько форм контроля знания:

  • 2 практических домашних задания
  • 3 теоретических домашних задания
  • 4 домашних лабораторных работы
  • устный экзамен

Результирующая оценка по дисциплине рассчитывается по формуле

Окончательная оценка = 0.3 * Экз + 0.3 * Практ + 0.4 * ( 3/7 * Теор + 4/7 * Лаб ))

Итоговая оценка округляется арифметически. Оценка за каждый тип заданий рассчитывается как среднее по всем заданиям данного типа. Каждое задание и экзамен оцениваются по 10-балльной шкале (по заданиям допускается дробная оценка). За некоторые задания можно будет получить бонусные баллы, о чем будет объявляться при выдаче задания. Оценка за экзамен является блокирующей.

Домашние задания

  1. В рамках курса предполагается выполнение двух практических заданий, трёх теоретических домашних заданий и четырёх лабораторных работ. Задания сдаются в системе anytask. Инвайт был разослан на групповые почты. Если вы его не получили, напишите об этом на почту курса.
  2. Все практические задания и лабораторные сдаются на Python 3. Код практических заданий должен быть обязательно предварительно сдан в систему ejudge. Формат логина в ejudge должен быть следующий: hse19_ + первая буква имени + фамилия. Пример: hse19_elobacheva. Конфигурация сервера проверки кода в ejudge: python==3.5.3, numpy==1.14.5, scikit-learn==0.19.2, scipy==1.1.0.
  3. Все задания должны выполняться студентами самостоятельно. Использование кода и решений от коллег или из открытых источников запрещено и считается плагиатом. Все студенты, замешанные в плагиате (в том числе и те, у кого списали), получают 0 баллов за задание, а также все стандартные последствия, подразумеваемые правилами НИУ ВШЭ.
  4. Для каждого задания устанавливается стандартный и жесткий сроки сдачи. Жесткий срок сдачи обычно отстоит от стандартного на одну неделю. За каждый день просрочки после стандартного срока сдачи устанавливается штраф в 1 балл. После жесткого срока сдачи задания на проверку не принимаются.

Примерные даты выдачи домашних заданий (они могут быть изменены!):

  • Практическая работа -- 12 сентября, 17 октября
  • Лабораторная работа -- 3 октября, 21 ноября, 28 ноября, 5 декабря
  • Теоретическое задание -- 19 сентября, 3 октября, 31 октября

Работы, присланные после 18 декабря, до конца семестра проверены не будут.

Экзамен

Экзамен пройдет 24 декабря c 15:00 в R206.

Экзамен на курсе является блокирующим, то есть при получении неудовлетворительной оценки за него вы получаете неудовлетворительную оценку за весь курс.
Билеты к экзамену

При подготовке ответа на экзамене разрешается пользоваться любыми материалами. При непосредственном ответе ничем пользоваться нельзя. Просьба обратить внимание на теоретический минимум по курсу — незнание ответов на вопросы теор. минимума автоматически влечёт неудовлетворительную оценку за экзамен. На экзамене дается час на подготовку ответа на билет, после чего вы отвечаете экзаменатору на вопросы из теоретического минимума, рассказываете билет, отвечаете на дополнительные вопросы по курсу и решаете задачи.

Расписание занятий

Видеозаписи лекций

Официальный конспект лекций в процессе (пока сделано до 2 лекции включительно)

Лекции по курсу изучаются студентами самостоятельно. Лекция по гауссовским процессам пройдет очно, о времени будет сообщено позднее. Изучение материалов лекции перед соответствующим семинаром обязательно!

Занятие Дата Название Материалы
1 11 сентября Байесовский подход к теории вероятностей, примеры байесовских рассуждений. лекция (презентация), лекция(конспект), лекция (саммари), семинар(задачи), семинар(конспект)
2 19 сентября Аналитический байесовский вывод, сопряжённые распределения, экспоненциальный класс распределений, примеры. лекция(конспект), семинар(задачи) семинар(конспект)
3 26 сентября Задача выбора модели по Байесу, принцип наибольшей обоснованности, примеры выбора вероятностной модели. лекция(презентация), лекция(конспект), семинар(задачи), семинар(конспект)
4 3 октября Метод релевантных векторов для задачи регрессии, автоматическое определение значимости. Матричные вычисления.

лекция(презентация), лекция(конспект), семинар(задачи 1 с разбором), семинар(задачи 2 с разбором), решения задач с семинара

5 10 октября Метод релевантных векторов для задачи классификации, приближение Лапласа. лекция(саммари), лекция(конспект), семинар(задачи), семинар(конспект)
6 17 октября Обучение при скрытых переменных, ЕМ-алгоритм в общем виде, байесовская модель метода главных компонент. лекция, лекция(конспект), семинар(задачи), семинар(конспект)
7 31 октября Вариационный подход для приближённого байесовского вывода. лекция, лекция (саммари), лекция(конспект),(задачи), семинар(конспект)
8 14 ноября Методы Монте-Карло с марковскими цепями (MCMC). лекция, семинар(задачи), семинар(конспект)
9 21 ноября Гибридный метод Монте-Карло с марковскими цепями и его масштабируемые обобщения. Hamiltonian dynamics, Langevin Dynamics, семинар(задачи)
10 28 ноября Гауссовские процессы для регрессии и классификации. материалы лекции изложены в разделе 6.4 Бишопа, семинар(задачи), семинар(конспект)
11 5 декабря Модель LDA для тематического моделирования. лекция, семинар(конспект), Статья по HDP
12 12 декабря Стохастический вариационный вывод. Вариационный автокодировщик. статья 1, статья 2

Замечание: рукописные конспекты лекций и семинаров это в первую очередь заметки лектора и семинаристов, а не материалы по курсу. В них могут содержать неточности!

Рекомендуемая литература

Полезные ссылки

Сайт одноименного курса, читаемого на ВМК МГУ.
Сайт группы Байесовских методов.
Простые и удобные заметки по матричным вычислениям и свойствам гауссовских распределений.
Памятка по теории вероятностей.