Математическая статистика 2022/2023 (основной поток) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Вопросы к коллоквиуму)
(Материалы)
 
(не показана одна промежуточная версия 2 участников)
Строка 6: Строка 6:
 
|| Лектор ||colspan="6"| [https://www.hse.ru/org/persons/768875836 Дарина Двинских]
 
|| Лектор ||colspan="6"| [https://www.hse.ru/org/persons/768875836 Дарина Двинских]
 
|-
 
|-
|| Семинарист || [https://t.me/DuckBinLaden Павел Захаров] || [https://t.me/denrakitin23 Денис Ракитин] || Денис Богуцкий || [https://t.me/artgoldman Артур Гольдман] || [https://t.me/dvini Дарина Двинских] || [https://t.me/levensons Илья Левин] || Евгений Лагутин
+
|| Семинарист || [https://t.me/DuckBinLaden Павел Бандит Захаров] || [https://t.me/denrakitin23 Денис Ракитин] || Денис Богуцкий || [https://t.me/artgoldman Артур Гольдман] || [https://t.me/dvini Дарина Двинских] || [https://t.me/levensons Илья Левин] || Евгений Лагутин
 
|-
 
|-
 
|| Ассистент(ы) || [https://t.me/vslvskyy Василевская Юлия] || [https://t.me/uliana_win Ульяна Виноградова] <br> [https://t.me/mathalex Бойков Алексей] || [https://t.me/tutugarin Ершов Иван] <br> [https://t.me/hey_m8 Гринев Тимофей] || Кирилл Тамогашев <br> [https://t.me/kkorolev1 Кирилл Королев] || [https://t.me/unconscious_i Иевлева Александра] <br> [https://t.me/abezrukovaa Анастасия Безрукова] || [https://t.me/tgritsaev Тимофей Грицаев] <br>  [https://t.me/LebesgueH Максимов Ян] || Антон Бельский <br> Варвара Руденко
 
|| Ассистент(ы) || [https://t.me/vslvskyy Василевская Юлия] || [https://t.me/uliana_win Ульяна Виноградова] <br> [https://t.me/mathalex Бойков Алексей] || [https://t.me/tutugarin Ершов Иван] <br> [https://t.me/hey_m8 Гринев Тимофей] || Кирилл Тамогашев <br> [https://t.me/kkorolev1 Кирилл Королев] || [https://t.me/unconscious_i Иевлева Александра] <br> [https://t.me/abezrukovaa Анастасия Безрукова] || [https://t.me/tgritsaev Тимофей Грицаев] <br>  [https://t.me/LebesgueH Максимов Ян] || Антон Бельский <br> Варвара Руденко
Строка 31: Строка 31:
 
|-
 
|-
 
! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=1289780746 213] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=963000718 215] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=834426897 216] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=716430634 217] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=697249085 218] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=1724401987 219]
 
! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=1289780746 213] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=963000718 215] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=834426897 216] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=716430634 217] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=697249085 218] !! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=1724401987 219]
 +
! [https://docs.google.com/spreadsheets/d/1w_AQSzEIQWHS3z-SJ64WDcBYHW6CCOEocBhztRiQyCU/edit#gid=1696647507 2110]
 
|}
 
|}
  
Строка 46: Строка 47:
 
В билетах будут два теоретических вопроса из программы курса (списка вопросов к коллоквиуму). При подготовке не разрешено ничем пользоваться. За коллоквиум можно набрать 10 баллов: билет - 6 балла, общение с экзаменатором - 4 балла. Экзаменатор может задавать как теоретические вопросы, так и давать задачи.
 
В билетах будут два теоретических вопроса из программы курса (списка вопросов к коллоквиуму). При подготовке не разрешено ничем пользоваться. За коллоквиум можно набрать 10 баллов: билет - 6 балла, общение с экзаменатором - 4 балла. Экзаменатор может задавать как теоретические вопросы, так и давать задачи.
  
=== Порядок захода ===
+
=== Порядок захода на коллоквиум №1===
 
{| class="wikitable" style="text-align:center"
 
{| class="wikitable" style="text-align:center"
 
|-
 
|-
 
! Время захода !! Группы !! Аудитория  
 
! Время захода !! Группы !! Аудитория  
 
|-
 
|-
|| 11:00 || 217, 218 ||  
+
|| 11:00 || 217, 218, 2110 || R201
 
|-
 
|-
|| 11:00 || 2110 || -
+
|| 14:40 || 213, 219 || R301
 
|-
 
|-
|| 14:40 || 213, 215 || R503
+
|| 16:40 ||   216 || R301
 
|-
 
|-
|| 16:40 ||  216, 219 || -
+
|| 18:00 ||  215 || R304
 
|}
 
|}
  
=== Результаты ===
+
=== Порядок захода на коллоквиум №2===
[https://docs.google.com/spreadsheets/d/1pwCCuEqxT_9aOfLA81Yf8GXJAmD7kiD3-aEf5FRIuG8/edit?usp=sharing Таблица результатов]
+
{| class="wikitable" style="text-align:center"
 +
|-
 +
! Время захода !! Группы !! Аудитория
 +
|-
 +
|| 11:00 || 217, 218, 2110 || R201
 +
|-
 +
|| 14:40 || 213, 219 || R301
 +
|-
 +
|| 16:40 ||  216 || R304
 +
|-
 +
|| 18:00 ||  215 || R304
 +
|}
 +
 
 +
 
 +
 
 +
== Экзамен ==
 +
=== Как проходит ===
 +
Экзамен будет проходить 23 июня с 11:00 до 14:00. С собой разрешено принести только ручку и лист А4 с (рукописными!) записями (можно с обеих сторон).
 +
 
 +
=== Темы ===
 +
* Оценки максимального правдоподобия, состоятельность
 +
* Байесовские оценки
 +
* Доверительные интервалы
 +
* Гипотезы, модели с монотонным отношением правдоподобия
 +
* Субгауссовские случайные величины
 +
 
 +
=== Распределение по аудиториям ===
 +
{| class="wikitable" style="text-align:center"
 +
|-
 +
! Группы !! Аудитория
 +
|-
 +
|| 213, 215, 219 || R304
 +
|-
 +
|| 217, 218 || R405
 +
|-
 +
||    216, 2110  || R503
 +
|}
  
 
== Материалы ==
 
== Материалы ==
 +
 +
 +
'''Конспект лекций с пилотного потока:'''
 +
 +
([https://www.overleaf.com/read/dvjhrjzcgfsm обновляемый конспект]);
 +
 +
=== Семинары ===
 +
* [https://disk.yandex.ru/d/g9HNty_ovGTRmQ/%D0%A0%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D1%8F%20%D1%81%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%D0%BE%D0%B2 Конспекты 213 группы от Бандита]
 +
 +
 +
'''Конспект лекций по темам второго коллоквиума, оформленные студентами:'''
 +
 +
[https://www.overleaf.com/read/rdsjnhwmdtry материал лекций для летнего коллоквиума]
  
 
=== Лекции ===
 
=== Лекции ===
Строка 78: Строка 128:
 
# [https://www.stat.cmu.edu/~larry/=stat705/Lecture14.pdf Байесовский риск и байесовская оценка. Байесовская оценка при квадратичной функции потерь. Минимаксные оценки через байесовские оценки и наихудшее априорное распределение.]   
 
# [https://www.stat.cmu.edu/~larry/=stat705/Lecture14.pdf Байесовский риск и байесовская оценка. Байесовская оценка при квадратичной функции потерь. Минимаксные оценки через байесовские оценки и наихудшее априорное распределение.]   
 
# [ https://web.stanford.edu/class/archive/stats/stats200/stats200.1172/Lecture18.pdf Точные доверительные интервалы.] Метод центральной статистики ([https://disk.yandex.ru/i/waXgDQWDh_rgTA Ивченко-Медведев, стр. 276])
 
# [ https://web.stanford.edu/class/archive/stats/stats200/stats200.1172/Lecture18.pdf Точные доверительные интервалы.] Метод центральной статистики ([https://disk.yandex.ru/i/waXgDQWDh_rgTA Ивченко-Медведев, стр. 276])
 
+
# Статистические гипотезы о виде распределения. Критерий согласия хи-квадрат Пирсона
 
+
# Критерий согласия Колмогорова
'''Конспект лекций с пилотного потока:'''
+
# Критерий Неймана-Пирсона
 
+
# Модели с монотонным отношением правдоподобия
([https://www.overleaf.com/read/dvjhrjzcgfsm обновляемый конспект]);
+
# Критерий хи-квадрат для проверки гипотезы об однородности
 
+
# Критерий хи-квадрат для проверки гипотезы о независимости
=== Вопросы к коллоквиуму ===
+
# p-value. Множественное тестирование
# Несмещенные, асимптотически несмещенные, состоятельные и сильно со- стоятельные оценки. Разложение среднеквадратичной ошибки оценивания в сумму дисперсии и квадрата смещения. Достаточное условие состоятель- ности асимптотически несмещенной оценки. ([https://www.overleaf.com/read/dvjhrjzcgfsm конспект, глава 3])
+
# Неравенства концентрации. Субгауссовские случайные величины
# Оптимальные оценки. Единственность оптимальной оценки в классе несмещенных оценок.  ([https://www.overleaf.com/read/dvjhrjzcgfsm конспект,  глава 3] или [https://disk.yandex.ru/i/waXgDQWDh_rgTA Ивченко-Медведев, стр. 168-170])
+
# Субэкспоненциальные случайные величины
# Функция правдоподобия, вклад выборки и информация Фишера. Регулярные семейства. Неравенство Рао–Крамера в случае скалярного параметра. Эффек- тивная оценка. Критерий эффективности. ] ([https://www.overleaf.com/read/dvjhrjzcgfsm конспект,  глава 4])
+
# Линейная регрессия
# Экспоненциальные семейства. Вклад выборки для экспоненциальных семейств. Эффективные оценки в экспоненциальных семействах. ([https://disk.yandex.ru/i/waXgDQWDh_rgTA Ивченко-Медведев, стр. 179-181])
+
# Выбор модели. Информационный критерий Акаики
# [https://www.stat.cmu.edu/~larry/=stat705/Lecture13.pdf Метод максимального правдоподобия] (см. 2 Maximum Likelihood). Асимптотические свойства оценки максимального правдоподобия: состоятельность и  [https://www.stat.cmu.edu/~larry/=stat705/Lecture15.pdf асимптотическая нормальность] ( см. 7 MLE Asymptotics)
+
# Байесовский информационный критерий
# [https://www.stat.cmu.edu/~larry/=stat705/Lecture12a.pdf Свойства экспоненциальных семейств: сохранениеструктурыэкспоненциального семейства для выборки и выпуклость нормировочной функции A(θ). Вогнутость логарифма функции правдоподобия в экспоненциальных семействах.]
+
# Ядерные оценки плотности. Оценка Надарая-Ватсона для непараметрической регрессии
# [https://davidrosenberg.github.io/ttml2021fall/background/conditional-expectation-notes.pdf Условное математическое ожидание, его свойства и связь с проекцией. Теорема о наилучшем среднеквадратичном приближении.]
+
# Достаточные статистики. Теорема Рао-Блекуэлла-Колмогорова. Полные достаточные статистики. Теорема об оптимальности оценок, являющихся функциями полных достаточных статистик. Уравнение несмещенности. ([https://www.overleaf.com/read/dvjhrjzcgfsm конспект,  глава 8] или [https://disk.yandex.ru/i/waXgDQWDh_rgTA Ивченко-Медведев, стр. 186-193, примеры в сам билет не входят])
+
# [https://www.stat.cmu.edu/~larry/=stat705/Lecture14.pdf Байесовский риск, байесовская оценка. Байесовская оценка при квадратичной функции потерь. Минимаксные оценки через байесовские оценки и наихудшее априорное рас- пределение.] (начиная с 1.3 Bayes estimators)
+
# Точные доверительные интервалы. Метод центральной статистики. ([https://www.overleaf.com/read/dvjhrjzcgfsm конспект,  глава 9] или [https://disk.yandex.ru/i/waXgDQWDh_rgTA Ивченко-Медведев, стр. 276-277, далее полезно посмотреть примеры построения для нормальной модели])
+
  
 
== Домашние задания ==
 
== Домашние задания ==
Строка 100: Строка 146:
  
 
=== Список ДЗ ===
 
=== Список ДЗ ===
* [https://youtu.be/dQw4w9WgXcQ Домашнее задание №0, дедлайн - 31.02, 23:59]
+
* [https://disk.yandex.ru/d/g9HNty_ovGTRmQ/%D0%94%D0%97 Домашние задания группы 213]
  
 
== Список рекомендуемой литературы ==
 
== Список рекомендуемой литературы ==

Текущая версия на 12:21, 11 октября 2023

Преподаватели и учебные ассистенты

Группа БПМИ213 БПМИ215 БПМИ216 БПМИ217 БПМИ218 БПМИ219 БПМИ2110
Лектор Дарина Двинских
Семинарист Павел Бандит Захаров Денис Ракитин Денис Богуцкий Артур Гольдман Дарина Двинских Илья Левин Евгений Лагутин
Ассистент(ы) Василевская Юлия Ульяна Виноградова
Бойков Алексей
Ершов Иван
Гринев Тимофей
Кирилл Тамогашев
Кирилл Королев
Иевлева Александра
Анастасия Безрукова
Тимофей Грицаев
Максимов Ян
Антон Бельский
Варвара Руденко
Группа в телеграмме Группа 213 Группа 215 [ Группа 216] Группа 217 Группа 218 [ Группа 219] [ Группа 2110]

Организационные моменты

Правила игры

Оценка за курс складывается из нескольких факторов:

  • Одна контрольная работа (письменная, ориентировочно после 3-го модуля);
  • Два коллоквиума;
  • Домашние задания. В среднем, на каждом семинаре будут выдавать по 2-3 задачи для самостоятельного решения, которые будет нужно письменно сдавать ассистентам;
  • Письменный экзамен;

Округляется только итоговый балл.

  • Оценка высчитывается по следующей формуле:

Оитог = 0.2 * ОКР + 0.15 * Околлоквиум 1 + 0.15 * Околлоквиум 2 + 0.2 * ОДЗ + 0.3 * Оэкзамен.

Ведомость с оценками

213 215 216 217 218 219 2110

Контрольные работы

Правила игры

На контрольную отвидится 2 часа. С собой разрешается принести лист А4 с (рукописными!) записями (можно с обеих сторон).

Сводка

Коллоквиумы

Как проходят

В билетах будут два теоретических вопроса из программы курса (списка вопросов к коллоквиуму). При подготовке не разрешено ничем пользоваться. За коллоквиум можно набрать 10 баллов: билет - 6 балла, общение с экзаменатором - 4 балла. Экзаменатор может задавать как теоретические вопросы, так и давать задачи.

Порядок захода на коллоквиум №1

Время захода Группы Аудитория
11:00 217, 218, 2110 R201
14:40 213, 219 R301
16:40 216 R301
18:00 215 R304

Порядок захода на коллоквиум №2

Время захода Группы Аудитория
11:00 217, 218, 2110 R201
14:40 213, 219 R301
16:40 216 R304
18:00 215 R304


Экзамен

Как проходит

Экзамен будет проходить 23 июня с 11:00 до 14:00. С собой разрешено принести только ручку и лист А4 с (рукописными!) записями (можно с обеих сторон).

Темы

  • Оценки максимального правдоподобия, состоятельность
  • Байесовские оценки
  • Доверительные интервалы
  • Гипотезы, модели с монотонным отношением правдоподобия
  • Субгауссовские случайные величины

Распределение по аудиториям

Группы Аудитория
213, 215, 219 R304
217, 218 R405
216, 2110 R503

Материалы

Конспект лекций с пилотного потока:

(обновляемый конспект);

Семинары


Конспект лекций по темам второго коллоквиума, оформленные студентами:

материал лекций для летнего коллоквиума

Лекции

  1. Вводная лекция, мотивация
  2. Метрика качества точечных оценок. Сравнение оценок: Байесовский, минимаксный и равномерные подходы. Bias-variance decomposition. Несмещенные и состоятельные оценки. (Лагутин)
  3. Сравнение оценок в равномерном подходе. Оптимальные оценки. Регулярные семейства (Ивченко-Медведев)
  4. Неравенство Рао-Крамера, информация Фишера, эффективная оценка (Ивченко-Медведев)
  5. Доказательство неравенство Рао-Крамера и сверхэффективные оценки (Ивченко-Медведев)
  6. Метод максимального правдоподобия
  7. Асимптотические свойства оценки максимального правдоподобия, экспоненциальные семейства, вогнутость функции правдоподобия для экспоненциального семейства https://davidrosenberg.github.io/ttml2021fall/background/conditional-expectation-notes.pdf
  8. Условное матожидание
  9. Достаточные статистики. Теорема Рао-Блекуэлла-Колмогорова.
  10. Полные достаточные статистики. Теорема об оптимальности оценок, являющихся функциями полных достаточных статистик.
  11. Байесовский риск и байесовская оценка. Байесовская оценка при квадратичной функции потерь. Минимаксные оценки через байесовские оценки и наихудшее априорное распределение.
  12. [ https://web.stanford.edu/class/archive/stats/stats200/stats200.1172/Lecture18.pdf Точные доверительные интервалы.] Метод центральной статистики (Ивченко-Медведев, стр. 276)
  13. Статистические гипотезы о виде распределения. Критерий согласия хи-квадрат Пирсона
  14. Критерий согласия Колмогорова
  15. Критерий Неймана-Пирсона
  16. Модели с монотонным отношением правдоподобия
  17. Критерий хи-квадрат для проверки гипотезы об однородности
  18. Критерий хи-квадрат для проверки гипотезы о независимости
  19. p-value. Множественное тестирование
  20. Неравенства концентрации. Субгауссовские случайные величины
  21. Субэкспоненциальные случайные величины
  22. Линейная регрессия
  23. Выбор модели. Информационный критерий Акаики
  24. Байесовский информационный критерий
  25. Ядерные оценки плотности. Оценка Надарая-Ватсона для непараметрической регрессии

Домашние задания

Дедлайн сдачи домашнего задания строгий. Разрешено сдать одно домашнее задание после дедлайна, но об этом нужно предварительно сообщить ассистенту.

Список ДЗ

Список рекомендуемой литературы

  • Ивченко Г. И., Медведев Ю. И., Введение в математическую статистику (ссылка);
  • М. Б. Лагутин Наглядная математическая статистика (ссылка);
  • Бородин А. Н., Элементарный курс теории вероятностей и математической статистики(ссылка);
  • Боровков А. А., Математическая статистика (ссылка);
  • Larry A. Wasserman All of Statistics: A Concise Course in Statistical Inference (ссылка);
  • Натан А. А., Горбачев О. Г., Гуз С. А., Математическая статистика (ссылка);
  • Ушаков В. Г., конспекты лекций по математической статистике (ВМК МГУ, ссылка);
  • Пучкин Н., конспекты лекций по статистической теории обучения (отсюда можно взять неравенства концентрации, ссылка).


Курсы


Страницы прошлых лет

Предупреждение: программа курса значительно изменилась по сравнению с прошлыми годами.

2020/2021 учебный год

2019/2020 учебный год