Математическая статистика КНАД 2025/26

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Математическая статистика (III - IV модули)

Преподаватели и учебные ассистенты

Группы БКНАД241 БКНАД242
Лектор Промыслов Платон Валерьевич

ppromyslov@hse.ru

Семинаристы Юрьева Голуба Валерьевна Числова Алёна Игоревна
Ассистенты Илья Судаков
Вероника Каменчук
Даниил Потехин

Ведомость

БКНАД241 БКНАД242

Ccылки на Google Classroom

БКНАД241 БКНАД242

Формула оценивания

Формула оценки: Итог = Округление(0.2 * ДЗ + 0.2 * КР + 0.2 * К + 0.1 * ЛАБ + 0.3 * Э)

где

  • ДЗ — средняя оценка за все домашние задания,
  • КР — оценка за контрольную работу,
  • К — оценка за коллоквиум,
  • ЛАБ - оценка за лабораторную работу,
  • Э — оценка за экзамен.

Округление арифметическое.

ДЗ
Домашние задания сдаются в Google Classroom.
Дедлайн сдачи домашних заданий жесткий. НО у Вас есть 7 дней, на которые Вы можете просрочить сдачу домашних заданий суммарно. Вы можете потратить эти 7 дней как угодно. Например, можно потратить все эти 7 дней лишь на одно ДЗ, или распределить эти дни на несколько домашних заданий (например, просрочить на день 7 домашних заданий). Также у Вас есть возможность взять 3 микропросрочки по 1 часу. На одно ДЗ можно взять лишь одну микропросрочку.
Важно: сдать ДЗ (включая любые просрочки) можно будет только до 15 июня, даже если Вы не истратили свой банк просрочек!!!

Лабораторная работа
Лабораторная работа сдается в Google Classroom. Дедлайн жесткий. Просрочек по лабораторной работе нет.

Автоматы

Накоп = Округление((0.2 * ДЗ + 0.2 * КР + 0.2 * К + 0.1 * ЛАБ) / 0.7)

Если Накоп >= 6, то Вы можете получить Накоп в качестве итоговой оценки, не приходя на экзамен.

Материалы

Темы лекций (план)

Блок 1. Оценивание параметров (Лекции 1–8)

  • Лекция 1. Условное математическое ожидание (УМО).
    Завершение темы из ТВ: УМО относительно сигма-алгебры. Свойства. Проекция в L^2. Тождество Вальда (подготовка к послед. анализу).
    Семинар 1: Вычисление УМО.
  • Лекция 2. Основные понятия и Эмпирическое распределение.
    Выборка, стат. модель. Эмпирическая функция распределения. Теорема Гливенко-Кантелли. Статистика Колмогорова D_n (распределение, но пока без критерия).
    Семинар 2: Эмпирическая функция, гистограммы, порядковые статистики.
    ДЗ-1 (УМО + Эмпирическое распределение)
  • Лекция 3. Точечные оценки и Метод моментов.
    Состоятельность (через ЗБЧ). Несмещенность. Метод моментов. Асимптотическая нормальность выборочных моментов.
    Семинар 3: Построение оценок методом моментов.
  • Лекция 4. Метод максимального правдоподобия (ММП).
    Функция правдоподобия. Уравнения правдоподобия. Информация Фишера (для одного наблюдения и выборки).
    Семинар 4: Построение ОМП для дискретных и непрерывных распределений.
    ДЗ-2 (Методы оценивания: ММ и ММП)
  • Лекция 5. Асимптотические свойства оценок.
    Асимптотическая нормальность ОМП (связь с информацией Фишера). Дельта-метод (построение асимптотического распределения функций от оценок).
    Семинар 5: Задачи на асимптотическую нормальность и Дельта-метод.
  • Лекция 6. Эффективность оценок.
    Функция риска (MSE). Неравенство Рао-Крамера. Эффективные оценки. Критерий эффективности для экспоненциального семейства.
    Семинар 6: Вычисление информации Фишера и границы Рао-Крамера.
  • Лекция 7. Достаточные и полные статистики.
    Критерий факторизации Неймана-Фишера. Полнота. Теорема Рао-Блэкуэлла-Колмогорова и Лемана-Шеффе.
    Семинар 7: Поиск достаточных статистик и улучшение оценок.
    ДЗ-3 (Свойства оценок: Эффективность, Достаточность, UMVUE)
  • Лекция 8. Интервальное оценивание.
    Точные доверительные интервалы (метод центральной статистики). Асимптотические доверительные интервалы (на основе ОМП).
    Семинар 8: Построение доверительных интервалов (для среднего, дисперсии, доли).

Блок 2. Проверка гипотез (Лекции 9–15)

  • Лекция 9. Теория проверки гипотез: Нейман-Пирсон.
    Гипотезы, ошибки I и II рода, уровень значимости, мощность. Лемма Неймана-Пирсона для простых гипотез (наиболее мощный критерий).
    Семинар 9: Построение НМ-критериев, вычисление мощности.
  • Лекция 10. Последовательный анализ Вальда.
    Идея последовательного тестирования (экономия наблюдений). Отношение правдоподобия. Границы Вальда A и B (связь с ошибками альфы и беты). Среднее число наблюдений.
    Семинар 10: Решение задач на последовательный анализ (SPRT).
    ДЗ-4 (Проверка гипотез: Нейман-Пирсон и Вальд)

КОЛЛОКВИУМ (Устный) — по материалам Лекций 1–10.

  • Лекция 11. Сложные гипотезы и LRT.
    Равномерно наиболее мощные критерии (UMP). Монотонное отношение правдоподобия. Тест отношения правдоподобия (Likelihood Ratio Test) и теорема Вилкса.
    Семинар 11: Задачи на UMP и LRT.
  • Лекция 12. Критерии согласия.
    Критерий хи-квадрат Пирсона (для простой и сложной гипотез). Теорема Фишера (про степени свободы). Критерий Колмогорова (для непрерывных распределений). Предельное распределение Колмогорова.
    Семинар 12: Проверка гипотез о виде распределения (Нормальность, Равномерность).
    ДЗ-5 (Сложные гипотезы, LRT и Критерии согласия)
  • Лекция 13. Гипотеза однородности (Две выборки).
    Постановка задачи однородности (H_0: F = G). Параметрические тесты: Критерий Стьюдента, Критерий Фишера. Непараметрические тесты: Критерий Смирнова (на основе эмпирических функций), Критерий Манна-Уитни (ранговый).
    Семинар 13: Гипотеза однородности: сравнение двух выборок (A/B тесты).
  • Лекция 14. Таблицы сопряженности и Независимость.
    Критерий хи-квадрат для проверки независимости признаков. Критерий однородности для дискретных данных. Меры связи.
    Семинар 14: Анализ категориальных данных.
  • Лекция 15. Множественная проверка гипотез.
    Проблема множественных сравнений. FWER (Бонферрони, Холм). FDR (Бенджамини-Хохберг) — стандарт в Data Science.
    Семинар 15: Множественная проверка гипотез (FWER, FDR).
    ДЗ-6 (Однородность, Категориальные данные, Множественная проверка)

Блок 3. Регрессия и Байес (Лекции 16–20)

  • Лекция 16. Линейная регрессия: МНК.
    Постановка задачи. Метод наименьших квадратов в матричном виде. Геометрическая интерпретация. Теорема Гаусса-Маркова.
    Семинар 16: Линейная регрессия: Метод Наименьших Квадратов.
  • Лекция 17. Линейная регрессия: Анализ и вывод.
    Нормальная регрессия. Доверительные интервалы для коэффициентов. Проверка гипотез (t-тест, F-тест). Коэффициент детерминации R^2.
    Семинар 17: Линейная регрессия: Статистический вывод.
    ДЗ-7 (Линейная регрессия: МНК и Анализ)
  • Лекция 18. Байесовский подход: Основы.
    Априорное и апостериорное распределение. Сопряженные распределения (Beta-Bernoulli, Normal-Normal, Gamma-Poisson).
    Семинар 18: Байесовский подход: Сопряженные распределения.
  • Лекция 19. Байесовское оценивание.
    Байесовские точечные оценки (матожидание, мода/MAP). Функция потерь и функция риска. Байесовские доверительные интервалы (Credible intervals).
    Семинар 19: Байесовское оценивание и теория решений.
    ДЗ-8 (Байесовский подход)
  • Лекция 20. Бутстреп (Bootstrap).
    Эмпирический бутстрап. Бутстреп-интервалы.
    Семинар 20: Бутстреп

Контроль

Экзамен

Коллоквиум

Коллоквиум ориентировочно будет проводиться после 10 лекции в классическом формате (то есть идея такая: Вы подключаетесь, Вам выдают билет, определенное время Вы готовитесь, и потом сдаете).

Контрольная работа

Литература

Рекомендуемая основная литература

Рекомендуемая дополнительная литература