Байесовские методы машинного обучения 2017 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Отчётность по курсу и критерии оценки)
 
(не показано 37 промежуточных версии 3 участников)
Строка 3: Строка 3:
 
'''Семинаристы:''' [https://www.hse.ru/org/persons/131072080 Екатерина Лобачева], Кирилл Неклюдов
 
'''Семинаристы:''' [https://www.hse.ru/org/persons/131072080 Екатерина Лобачева], Кирилл Неклюдов
  
'''Контакты:''' по всем вопросам, связанным с курсом, просьба писать на '''bayesml@gmail.com'''. В название письма обязательно добавлять '''[ФКН БММО17]'''.
+
'''Контакты:''' по всем вопросам, связанным с курсом, просьба писать на '''bayesml@gmail.com'''. В название письма обязательно добавлять '''[ФКН БММО17]'''.<br />
 +
'''[https://docs.google.com/spreadsheets/d/1tgKLaeHXwb3nfHKGbZ2oBOLRGAesfo9qLZjA8H-dELU/edit?usp=sharing Таблица с оценками]'''
 +
 
 +
Преподаватели в чате бывают, но не всегда. По всем важным вопросам стоит писать на почту.
  
 
===Краткое описание===
 
===Краткое описание===
Строка 13: Строка 16:
  
 
=== Новости ===
 
=== Новости ===
 +
# На странице курса в anytask (http://anytask.org/course/221) появилось первое практическое задание. Дедлайн по заданию 23:59 25-09-2017.
 +
# На странице курса в anytask появилось первое теоретическое задание. Дедлайн по заданию 23:59 30-09-2017.
 +
# На странице курса в anytask появилось второе теоретическое задание. Дедлайн по заданию 23:59 09-10-2017.
 +
# На странице курса в anytask появилась первая лабораторная работа. Дедлайн по заданию 23:59 17-10-2017.
 +
# На странице курса в anytask появилось второе практическое задание. Дедлайн по заданию 23:59 30-10-2017.
 +
# На странице курса в anytask появилось третье теоретическое задание. Дедлайн по заданию 23:59 06-11-2017.
 +
# На странице курса в anytask появилась вторая лабораторная работа. Дедлайн по заданию 23:59 20-11-2017.
 +
# На странице курса в anytask появилась третья лабораторная работа. Дедлайн по заданию 23:59 27-11-2017.
 +
# На странице курса в anytask появилась четвертая лабораторная работа. Дедлайн по заданию 23:59 11-12-2017.
  
 
===Отчётность по курсу и критерии оценки===
 
===Отчётность по курсу и критерии оценки===
Строка 24: Строка 36:
 
Результирующая оценка по дисциплине рассчитывается по формуле
 
Результирующая оценка по дисциплине рассчитывается по формуле
  
O_итог=0.7 O_накопл + 0.3 O_экз
+
'''O_итог = 0.7 * O_накопл + 0.3 * O_экз'''
  
Накопленная и итоговая оценки округляются арифметически.
+
Накопленная и итоговая оценки округляются арифметически. Накопленная оценка рассчитывается по формуле
  
Накопленная оценка рассчитывается по формуле
+
'''O_накопл = 3/7 * O_практ + 4/49 * (3 * O_теор + 4 * О_лаб)'''
  
O_накопл= 3/7 * O_практ + 4/49 * (3 * O_теор + 4 * О_лаб)
+
Эта формула выглядит страшно, но на деле она просто означает, что за практические работы можно заработать 3 балла в итоговую оценку, а за теоретические и лабораторные вместе - 4 балла. Оценка за каждый тип заданий рассчитывается как среднее по всем заданиям данного типа. Каждое задание и экзамен оцениваются по 10-балльной шкале (по заданиям допускается дробная оценка).
 
+
Эта формула выглядит страшно, но на деле она просто означает, что за практические работы можно заработать 3 балла в итоговую оценку, а за теоретические и лабораторные вместе - 4 балла. Оценка за каждый тип заданий рассчитывается как среднее по всем заданиям данного типа. Каждое задание и экзамен оцениваются по 10-балльной шкале (по заданиям допускается дробная оценка). Для каждого задания устанавливается срок сдачи. За каждый день просрочки сдачи практического задания устанавливается штраф 0.3 балла, но суммарно не более 6 баллов (чтобы студенты имели возможность выполнить задание на положительную оценку даже при максимально поздней сдаче). Лабораторные работы и теоретические задания после срока не принимаются.
+
  
 
=== Экзамен ===
 
=== Экзамен ===
 +
 +
Экзамен состоится 22 декабря в 13:00 для 142 группы и в 15:00 для 141 группы. Мы начнем в 311 аудитории, а потом переедем в 402. 141 группе подходить сразу в 402.
 +
 +
При подготовке ответа на экзамене разрешается пользоваться любыми материалами. При непосредственном ответе ничем пользоваться нельзя. Просьба обратить внимание на теоретический минимум по курсу — незнание ответов на вопросы теор. минимума автоматически влечёт неудовлетворительную оценку за экзамен. На экзамене дается час на подготовку ответа на билет, после чего вы отвечаете экзаменатору на вопросы из теоретического минимума, рассказываете билет, отвечаете на дополнительные вопросы по курсу и решаете задачи.
 +
 +
[https://drive.google.com/file/d/1Cpcf2DZb2QU1JUYg4nytu8Ye6I7lpP7m/view?usp=sharing Вопросы к экзамену]
  
 
===Домашние задания  ===
 
===Домашние задания  ===
 +
# В рамках курса предполагается выполнение двух практических заданий, трёх теоретических домашних заданий и четырёх лабораторных работ. Задания сдаются в системе anytask. Ссылка на курс http://anytask.org/course/221
 +
# Пароль для курса был выслан всем на почту. Если вы по какой-то причине не получили пароль, напишите об этом на почту курса.
 +
# Все практические задания и лабораторные сдаются на Python 3.
 +
# Задания выполняются самостоятельно. Если задание выполнялось сообща, или использовались какие-либо сторонние коды и материалы, то об этом должно быть написано в отчете. В противном случае „похожие“ решения считаются плагиатом и все задействованные студенты (в том числе те, у кого списали) будут сурово наказаны.
 +
# Практические задания оцениваются из 10 баллов. За сдачу заданий позже срока начисляется штраф в размере 0.3 балла за каждый день просрочки, но суммарно не более 6 баллов.
 +
# Теоретические задания и лабораторные работы также оцениваются из 10 баллов. За сдачу заданий позже срока начисляется штраф в размере 0.3 балла за каждый день просрочки. Решения не принимаются к проверке спустя неделю после срока.
 +
# Первая проверка работ будет осуществляться через неделю после срока сдачи заданий. Присланные позже практические работы будут проверены в конце семестра.
  
 
=== Расписание занятий ===
 
=== Расписание занятий ===
 +
 +
{| class="wikitable"
 +
|-
 +
! '''Занятие''' !! '''Дата''' !! '''Название''' !! '''Материалы'''
 +
|-
 +
| 1 || 7, 11 сентября || Лекция и семинар: Байесовский подход к теории вероятностей, примеры байесовских рассуждений. || [https://bayesgroup.github.io/bmml/2016/Lectures/lecture01_presentation.pdf лекция (презентация)], [https://bayesgroup.github.io/bmml/2016/Lectures/lecture01_summary.pdf лекция (саммари)], [https://bayesgroup.github.io/bmml/2016/Seminars/BMML_sem1_2016.pdf семинар]
 +
|-
 +
| 2 || 18 сентября || Лекция и семинар: Аналитический байесовский вывод, сопряжённые распределения, экспоненциальный класс распределений, примеры. || [http://bayesgroup.github.io/bmml/2016/Seminars/BMML_sem2_2016.pdf семинар]
 +
|-
 +
| 3 || 21, 25 сентября || Лекция и семинар: Задача выбора модели по Байесу, принцип наибольшей обоснованности, примеры выбора вероятностной модели. || [http://www.machinelearning.ru/wiki/images/b/bd/BMMO11_5.pdf лекция], [https://drive.google.com/open?id=0B7TWwiIrcJstZExmM2ZtTFhPMFk семинар]
 +
|-
 +
| 4 || 28 сентября, 2 октября|| Лекция и семинар: Метод релевантных векторов для задачи регрессии, автоматическое определение значимости. Матричные вычисления. ||
 +
[https://bayesgroup.github.io/bmml/2016/Lectures/lecture04_presentation.pdf лекция], [http://www.machinelearning.ru/wiki/images/2/2a/Matrix-Gauss.pdf семинар]
 +
|-
 +
| 5 || 5, 9 октября || Лекция и семинар: Метод релевантных векторов для задачи классификации, приближение Лапласа. || [http://www.machinelearning.ru/wiki/images/6/6c/BMMO11_8.pdf лекция], [https://github.com/bayesgroup/bayesgroup.github.io/blob/master/bmml/2016/Seminars/BMML_sem5_2016.pdf семинар]
 +
|-
 +
| 6 || 12, 16 октября || Лекция и семинар: Обучение при скрытых переменных, ЕМ-алгоритм в общем виде, байесовская модель метода главных компонент. || [http://www.machinelearning.ru/wiki/images/7/73/BMMO11_11.pdf лекция], [https://github.com/bayesgroup/bayesgroup.github.io/blob/master/bmml/2016/Seminars/BMML_sem6_2016.pdf семинар]
 +
|-
 +
| 7 || 19, 30 октября || Лекция и семинар: Вариационный подход для приближённого байесовского вывода. || [http://www.machinelearning.ru/wiki/images/5/57/BMMO11_9.pdf лекция], [http://www.machinelearning.ru/wiki/images/6/60/BMMO14_variational_lecture.pdf лекция (саммари)], [http://www.machinelearning.ru/wiki/images/8/80/BMML15_S08_variational_inference.pdf семинар]
 +
|-
 +
| 8 || 2, 6 ноября || Лекция и семинар: Методы Монте-Карло с марковскими цепями (MCMC). || [http://www.machinelearning.ru/wiki/images/6/6b/BMMO11_10.pdf лекция], [http://www.machinelearning.ru/wiki/images/b/b9/BMMO8_2.pdf семинар]
 +
|-
 +
| 9 || 9, 13 ноября || Лекция и семинар: Гибридный метод Монте-Карло с марковскими цепями и его масштабируемые обобщения. || [http://www.machinelearning.ru/wiki/images/c/c3/S09_HMC.pdf семинар]
 +
|-
 +
| 10 || 16, 20 ноября || Лекция и семинар: Гауссовские процессы для регрессии и классификации. || [http://www.machinelearning.ru/wiki/images/8/81/S11_GP_BMML16.pdf семинар]
 +
|-
 +
| 11 || 23, 27 ноября || Лекция и семинар: Процессы Дирихле и непараметрические байесовские модели. || [http://www.machinelearning.ru/wiki/images/f/f7/DirichletProcessNotes.pdf лекция], [http://www.machinelearning.ru/wiki/images/f/f3/BMMO10_2.pdf семинар], [http://www.cs.columbia.edu/~blei/papers/BleiJordan2004.pdf paper 1], [https://www.ics.uci.edu/~welling/publications/papers/cvdp-v6.pdf paper 2]
 +
|-
 +
| 12 || 30 ноября, 4 декабря || Лекция и семинар: Модель LDA для тематического моделирования. || [http://www.machinelearning.ru/wiki/images/8/82/BMMO11_14.pdf лекция], [http://www.cs.berkeley.edu/~jordan/papers/hierarchical-dp.pdf Статья по HDP]
 +
|-
 +
| 13 || 14 декабря || Лекция: Стохастический вариационный вывод. Вариационный автокодировщик. || [http://jmlr.org/papers/v14/hoffman13a.html статья 1], [https://arxiv.org/abs/1312.6114 статья 2]
 +
|}
  
 
====Рекомендуемая литература  ====
 
====Рекомендуемая литература  ====
Строка 52: Строка 107:
 
[http://bayesgroup.ru Сайт] группы Байесовских методов.<br />
 
[http://bayesgroup.ru Сайт] группы Байесовских методов.<br />
 
Простые и удобные [http://cs.nyu.edu/~roweis/notes.html заметки] по матричным вычислениям и свойствам гауссовских распределений. <br />
 
Простые и удобные [http://cs.nyu.edu/~roweis/notes.html заметки] по матричным вычислениям и свойствам гауссовских распределений. <br />
[http://matthias.vallentin.net/probability-and-statistics-cookbook/ Памятка] по теории вероятностей.
+
[http://statistics.zone/ Памятка] по теории вероятностей.

Текущая версия на 12:24, 30 марта 2018

Лектор: Дмитрий Петрович Ветров

Семинаристы: Екатерина Лобачева, Кирилл Неклюдов

Контакты: по всем вопросам, связанным с курсом, просьба писать на bayesml@gmail.com. В название письма обязательно добавлять [ФКН БММО17].
Таблица с оценками

Преподаватели в чате бывают, но не всегда. По всем важным вопросам стоит писать на почту.

Краткое описание

Bayes.jpeg

Курс посвящен т.н. байесовским методам решения различных задач машинного обучения (классификации, восстановления регрессии, уменьшения размерности, разделения смесей, тематического моделирования и др.), которые в настоящее время активно развиваются в мире. Большинство современных научных публикаций по машинному обучению используют вероятностное моделирование, опирающееся на байесовский подход к теории вероятностей. Последний позволяет эффективно учитывать различные предпочтения пользователя при построении решающих правил прогноза. Кроме того, он позволяет решать задачи выбора структурных параметров модели. В частности, здесь удается решать без комбинаторного перебора задачи селекции признаков, выбора числа кластеров в данных, размерности редуцированного пространства при уменьшении размерности, значений коэффициентов регуляризации и пр. В байесовском подходе вероятность интерпретируется как мера незнания, а не как объективная случайность. Простые правила оперирования с вероятностью, такие как формула полной вероятности и формула Байеса, позволяют проводить рассуждения в условиях неопределенности. В этом смысле байесовский подход к теории вероятностей можно рассматривать как обобщение классической булевой логики.

Основной задачей курса является привитие студентам навыков самостоятельного построения сложных вероятностных моделей обработки данных, используя стандартные модели в качестве своеобразных "кирпичиков". Особое внимание уделяется приближенным байесовским методам, позволяющим обсчитывать сложные вероятностные модели.

Новости

  1. На странице курса в anytask (http://anytask.org/course/221) появилось первое практическое задание. Дедлайн по заданию 23:59 25-09-2017.
  2. На странице курса в anytask появилось первое теоретическое задание. Дедлайн по заданию 23:59 30-09-2017.
  3. На странице курса в anytask появилось второе теоретическое задание. Дедлайн по заданию 23:59 09-10-2017.
  4. На странице курса в anytask появилась первая лабораторная работа. Дедлайн по заданию 23:59 17-10-2017.
  5. На странице курса в anytask появилось второе практическое задание. Дедлайн по заданию 23:59 30-10-2017.
  6. На странице курса в anytask появилось третье теоретическое задание. Дедлайн по заданию 23:59 06-11-2017.
  7. На странице курса в anytask появилась вторая лабораторная работа. Дедлайн по заданию 23:59 20-11-2017.
  8. На странице курса в anytask появилась третья лабораторная работа. Дедлайн по заданию 23:59 27-11-2017.
  9. На странице курса в anytask появилась четвертая лабораторная работа. Дедлайн по заданию 23:59 11-12-2017.

Отчётность по курсу и критерии оценки

В курсе предусмотрено несколько форм контроля знания:

  • 2 практических домашних задания
  • 3 теоретических домашних задания
  • 4 домашних лабораторных работы
  • устный экзамен

Результирующая оценка по дисциплине рассчитывается по формуле

O_итог = 0.7 * O_накопл + 0.3 * O_экз

Накопленная и итоговая оценки округляются арифметически. Накопленная оценка рассчитывается по формуле

O_накопл = 3/7 * O_практ + 4/49 * (3 * O_теор + 4 * О_лаб)

Эта формула выглядит страшно, но на деле она просто означает, что за практические работы можно заработать 3 балла в итоговую оценку, а за теоретические и лабораторные вместе - 4 балла. Оценка за каждый тип заданий рассчитывается как среднее по всем заданиям данного типа. Каждое задание и экзамен оцениваются по 10-балльной шкале (по заданиям допускается дробная оценка).

Экзамен

Экзамен состоится 22 декабря в 13:00 для 142 группы и в 15:00 для 141 группы. Мы начнем в 311 аудитории, а потом переедем в 402. 141 группе подходить сразу в 402.

При подготовке ответа на экзамене разрешается пользоваться любыми материалами. При непосредственном ответе ничем пользоваться нельзя. Просьба обратить внимание на теоретический минимум по курсу — незнание ответов на вопросы теор. минимума автоматически влечёт неудовлетворительную оценку за экзамен. На экзамене дается час на подготовку ответа на билет, после чего вы отвечаете экзаменатору на вопросы из теоретического минимума, рассказываете билет, отвечаете на дополнительные вопросы по курсу и решаете задачи.

Вопросы к экзамену

Домашние задания

  1. В рамках курса предполагается выполнение двух практических заданий, трёх теоретических домашних заданий и четырёх лабораторных работ. Задания сдаются в системе anytask. Ссылка на курс http://anytask.org/course/221
  2. Пароль для курса был выслан всем на почту. Если вы по какой-то причине не получили пароль, напишите об этом на почту курса.
  3. Все практические задания и лабораторные сдаются на Python 3.
  4. Задания выполняются самостоятельно. Если задание выполнялось сообща, или использовались какие-либо сторонние коды и материалы, то об этом должно быть написано в отчете. В противном случае „похожие“ решения считаются плагиатом и все задействованные студенты (в том числе те, у кого списали) будут сурово наказаны.
  5. Практические задания оцениваются из 10 баллов. За сдачу заданий позже срока начисляется штраф в размере 0.3 балла за каждый день просрочки, но суммарно не более 6 баллов.
  6. Теоретические задания и лабораторные работы также оцениваются из 10 баллов. За сдачу заданий позже срока начисляется штраф в размере 0.3 балла за каждый день просрочки. Решения не принимаются к проверке спустя неделю после срока.
  7. Первая проверка работ будет осуществляться через неделю после срока сдачи заданий. Присланные позже практические работы будут проверены в конце семестра.

Расписание занятий

Занятие Дата Название Материалы
1 7, 11 сентября Лекция и семинар: Байесовский подход к теории вероятностей, примеры байесовских рассуждений. лекция (презентация), лекция (саммари), семинар
2 18 сентября Лекция и семинар: Аналитический байесовский вывод, сопряжённые распределения, экспоненциальный класс распределений, примеры. семинар
3 21, 25 сентября Лекция и семинар: Задача выбора модели по Байесу, принцип наибольшей обоснованности, примеры выбора вероятностной модели. лекция, семинар
4 28 сентября, 2 октября Лекция и семинар: Метод релевантных векторов для задачи регрессии, автоматическое определение значимости. Матричные вычисления.

лекция, семинар

5 5, 9 октября Лекция и семинар: Метод релевантных векторов для задачи классификации, приближение Лапласа. лекция, семинар
6 12, 16 октября Лекция и семинар: Обучение при скрытых переменных, ЕМ-алгоритм в общем виде, байесовская модель метода главных компонент. лекция, семинар
7 19, 30 октября Лекция и семинар: Вариационный подход для приближённого байесовского вывода. лекция, лекция (саммари), семинар
8 2, 6 ноября Лекция и семинар: Методы Монте-Карло с марковскими цепями (MCMC). лекция, семинар
9 9, 13 ноября Лекция и семинар: Гибридный метод Монте-Карло с марковскими цепями и его масштабируемые обобщения. семинар
10 16, 20 ноября Лекция и семинар: Гауссовские процессы для регрессии и классификации. семинар
11 23, 27 ноября Лекция и семинар: Процессы Дирихле и непараметрические байесовские модели. лекция, семинар, paper 1, paper 2
12 30 ноября, 4 декабря Лекция и семинар: Модель LDA для тематического моделирования. лекция, Статья по HDP
13 14 декабря Лекция: Стохастический вариационный вывод. Вариационный автокодировщик. статья 1, статья 2

Рекомендуемая литература

Полезные ссылки

Сайт одноименного курса, читаемого на ВМК МГУ.
Сайт группы Байесовских методов.
Простые и удобные заметки по матричным вычислениям и свойствам гауссовских распределений.
Памятка по теории вероятностей.