Прикладная статистика в машинном обучении 20/21
Содержание
О курсе
Курс читается для студентов 3-го курса в 1-2 модулях.
Лектор: Демешев Борис Борисович
Лекции проходят по пятницам (09:30 - 10:50) онлайн на вышкинской vr360.
Семинарист: Владимир Омелюсик
Семинары проходят по вторникам в 13:00 - 14:20 в ауд. G115 и в 14:40 - 16:00 в D504
Учебные ассистенты: Камилла Бахтиева (181), Наталия Бондаренко (182)
Полезные ссылки
Боевой листок
Лекции
[10 сентября] Лекция 1: Метод максимального правдоподобия: точечные и интервальные оценки.
[17 сентября] Лекция 2: Тест отношения правдоподобия и тест Вальда.
- видео
- Почитать: Engle, LR, LM, W tests
- Тех-конспект лекции
[24 сентября] Лекция 3: Тест множителей Лагранжа и энтропия.
- видео
- Почитать: Visual Information
- Тех-конспект лекции
[1 октября] Лекция 4: EM-алгоритм.
[8 октября] Лекция 5: EM-алгоритм и Bootstrap.
- видео
- Почитать: Tim Hesterberg, What teachers should know about bootstrap?, Jeremy Orloff Bootstrap CI
- конспект
- Тех-конспект лекции
[15 октября] Лекция 6: Регрессия и нормальное распределение.
- Почитать: Stahl, Evolution of the Normal distribution, Jaynes, Normal distribution (chapter from Probability: the logic of Science
- конспект
- печатный конспект, страницы 26-27
- Тех-конспект лекции
[22 октября] Лекция 7: Распределение хи-квадрат и F-распределение. F-тест.
[29 октября] Лекция 8: Повтор про F-распределение, t-распределение.
[5 ноября] Лекция 9: Гетероскедастичность и бутстрэп
[13 ноября] Лекция 10: разбор задач из контрольной
[20 ноября] Лекция 11: Гостевая лекция: метрики, MDE, бутстрэп.
[27 ноября] Лекция 12: Байесовский подход
[4 декабря] Лекция 13: Байесовский подход: продолжение
[11 декабря] Лекция 14: Алгоритм Метрополиса-Гастингса
[18 декабря] Лекция 15:
Если что, все тех-конспекты и конспекты от руки, что указаны здесь, лежат в этой папке, поэтому если мы ошиблись со ссылками (а мы могли), то ищите нужный файл в ней
Семинары
Семинар 1: Метод максимального правдоподобия.
Семинар 2: Тесты LR, LM и Wald.
Семинар 3: Энтропия и дивергенция Кульбака-Лейблера.
- Конспект
- Видео
- Заметки (стр. 16) NB: Кульбак!
Семинар 4: EM-алгоритм.
Семинар 5: EM-алгоритм и Bootstrap.
Семинар 6: Геометрия МНК.
Семинар 7: Распределения.
Семинар 8: Тестирование гипотез в линейной регрессии.
Семинар 9: Гетероскедастичность.
Семинар 10: Мультиколлинеарность. Отбор регрессоров.
Семинар 11: Эндогенность.
Семинар 12: Множественное тестирование. Байесовские методы.
Семинар 13: Байесовские методы.
Семинар 14: Байесовские методы.
Домашние задания
Домашнее задание 1. Метод максимального правдоподобия.
Дедлайн: 11.10.2020, 23:59 МСК
[Условие]
Домашнее задание 2. EM-алгоритм. Линейная регрессия.
Дедлайн: 01.12.2020, 23:59 МСК
[Условие]
Домашнее задание 3. Тестирование гипотез. Байесовский подход.
Дедлайн: 17.12.2020, 23:59 МСК
[Условие]
Бонусное домашнее задание
Дедлайн: 17.12.2020, 23:59 МСК
[Условие]
Задания для подготовки
Квиз 2. Дивергенция Кульбака-Лейблера. EM-алгоритм.
[Условие]
Квиз 3. Проверка гипотез в линейной модели. Гетероскедастичность.
[Условие]
Квиз 4. Тестирование гипотез. Байесовский подход.
[Условие]
Консультации
Консультация 25.10.2020.
Отчётность по курсу и критерии оценки
Домашние задания
Домашние задания загружаются в личный репозиторий в GitHub Classroom.
Правила оформления решений находятся на первой странице каждого домашнего задания.
Контрольная работа
Контрольная работа состоится онлайн 7-го ноября с 18:00 до 21:00. В контрольную работу войдут задачи по темам лекций и семинаров.
[Задание]
Экзамен
Экзамен состоится онлайн 21 декабря с 13:00 до 16:00. По формату экзамен будет похож на контрольную работу. Вопрос об автоматах уточняется.
Написание пропущенных работ
19 декабря (время уточняется) можно будет:
- Написать неограниченное число пропущенных по уважительной причине квизов или контрольную.
- Написать один любой пропущенный по любой причине квиз.
- Переписать один любой квиз со штрафом: максимум можно будет получить 8 баллов (выставляется минимум из количества набранных баллов и 8).
Итоговая оценка за курс
Итоговая оценка за курс рассчитывается по следующей формуле: Итог = 0.3 × ДЗ + 0.3 × КР + 0.2 × К + 0.2 × Э,
где
ДЗ — усреднённая оценка за все домашние задания,
КР — оценка за контрольную работу,
Э — оценка за экзамен,
К — усреднённая оценка за все квизы на семинарах.
Округление арифметическое, округляется только итоговая оценка.