Time series modelling 22 23
Содержание
О курсе
Курс по выбору для студентов для студентов 3 курса в 3-4 модулях.
Лектор: Демешев Борис Борисович
Лекции проходят онлайн
Ссылка:
Семинарист: Зехов Матвей Сергеевич
Семинары проходят онлайн
Ссылка:
Итоговая оценка за курс
ДЗ = 0.2 * ДЗ_1 + 0.2 * ДЗ_2 + 0.2 * ДЗ_3 + 0.2 * ДЗ_4 + 0.2 * ДЗ_теор.
Накоп. = ⅔ * ДЗ + ⅓ * КР
Итог = Округление(0.75 * Накоп. + 0.25 * Экз.)
где ДЗ_i — оценка за i-е практическое ДЗ, ДЗ_теор. – оценка за теоретическое ДЗ, КР — оценка за контрольную работу, Накоп. — накопленная оценка. Экз. — оценка за экзамен.
Округление арифметическое.
Автоматы
Всем студентам может быть автоматом выставлена оценка за экзамен, равная Минимум(7,Накоп.). Итоговая оценка будет рассчитана по стандартной формуле. При явке на экзамен эта возможность аннулируется.
Дополнительные условия
- При невозможности выполнения любого из ДЗ по уважительной причине и при наличии соответствующей справки, студент вправе перенести вес ДЗ на Экзамен. Для этого необходимо передать справку в учебную часть, а также уведомить семинариста.
- При пропуске КР по уважительной причине вес КР переносится на Экзамен. Автомат в таком случае не может быть выставлен.
Полезные ссылки
Бортовой журнал
Неделя 1
Лекция: Различные задачи на рядах. Общее про ряды: сезонность, цикличность, тренд. Создание признаков. Лаг, идея растущего и идея скользящего окна. Запись Конспект
Семинар: Вспомнить всё! Основные понятия математической статистики в контексте временных рядов. Задача линейной регрессии. Метод максимального правдоподобия. Статистические свойства оценок. Тестирование гипотез. Загрузка и обработка данных с датами. Периодические и непериодические данные. Основные особенности строения временных рядов. Автокорреляции и частные автокорреляции. Запись Ноутбук 1 Ноутбук 2
Неделя 2
Лекция: LOESS-регрессия. Интенсивность тренда. STL-разложение. MSTL-разложение. Запись Конспект Статья про LOESS STL простым языком Оригинальная статья про STL Фичи STL
Семинар: Обработка пропусков. LOESS-регрессия. STL-разложение. Инжиниринг фичей и использование стандартных регрессоров sklearn. Многошаговое прогнозирование. Прямая и рекурсивная стратегии многошагового прогнозирования. Хорошая статья про стратегии Запись Ноутбук
Неделя 3
Лекция: ETS-модель. Правдоподобие ETS-модели. Запись Конспект
Семинар: Модели экспоненциального сглаживания. Модели Хольта-Винтерса. Модели ETS. Запись Конспект Глава книги Хиндмана
Неделя 4
Лекция: Мультипликативные ETS-модели. Информационный критерий Акаике. Дивергенция Кульбака-Лейблера. Запись Конспект
Семинар: Примеры оценки ETS-моделей на данных. Общий алгоритм работы с временными рядами. Запись Ноутбук
Неделя 5
Лекция: Детерминированные процессы. Теорема Вольда. Белый шум. MA-процесс. Оператор лага. Автокорреляция и частная автокорреляция. Запись Конспект
Семинар: Стационарные процессы. Процессы белого шума. Тестирование данных на наличие серийных автокорреляций. MA(q)-процесс. Вывод теоретических ACF и PACF. Прогнозирование среднего и дисперсии MA(q)-процесса. Запись Ноутбук Конспект
Неделя 6
Лекция: Разница между процессом и уравнением. AR(p)-процесс. Стационарные решения AR(p)-уравнения. Запись Конспект
Семинар: AR(p)-процесс. Корреляционные характеристики AR(p)-процесса. Прогнозирование среднего и дисперсии AR(p)-процесса. Запись Ноутбук Конспект
Неделя 7
Лекция: ARMA, ARIMA, SARIMA, KPSS-тест. Запись Конспект
Семинар: Детерминированный и стохастический тренд. Порядок интеграции. ARIMA(p,d,q)-процесс. Запись Конспект
Неделя 8
Лекция: Пропуск
Семинар: Обзор основных соревнований по временным рядам. Запись
Неделя 9
Лекция: ADF-тест. ETS как частный случай ARIMA. Выбор между моделями. Запись Конспект
Семинар: Подготовка к КР. Запись Конспект
Неделя 10
Лекция: Подготовка к КР. Запись Конспект
Семинар: Введение в оценку риска. Value-at-Risk. Expected shortfall. Исторический и параметрический подходы. Запись Ноутбук 1 Ноутбук 2
Неделя 11
Лекция: GARCH-модель. Запись Конспект
Семинар: КР
Неделя 12
Лекция: Копулы. Запись Конспект
Семинар: ARCH-GARCH. Filtered Historical Simulation. Запись Ноутбук Конспект
Неделя 13
Лекция: Копулы (продолжение). Правдоподобие GARCH-модели. Запись Конспект
Семинар: Оценка риска портфеля. Базовые модели. Совместные распределения и ядровая оценка плотности. Запись Ноутбук Конспект
Неделя 14
Лекция: Гауссовские процессы. Запись Конспект
Семинар: Гауссовские процессы. Запись Ноутбук Презентация
Неделя 15
Лекция: Байесовская оптимизация. Многомерные модели. VAR. Запись Конспект
Семинар: Байесовская оптимизация. Запись Ноутбук Конспект
Неделя 16
Семинар: Никто не пришёл. /Грустный тромбон/
Неделя 17
Лекция: Иерархические модели. Запись Конспект
Семинар: IRF. SVAR. Иерархические модели. Запись Ноутбук 1 Ноутбук 2 Ноутбук 3 Конспект
Неделя 18
Лекция: Классификация временных рядов. DTW. Запись Конспект
Семинар: Классификация временных рядов. Запись Ноутбук Конспект
Неделя 19
Лекция: Введение в байесовский анализ. Prophet. DLT. Запись Конспект
Семинар: Prophet. DLT (Orbit). Запись Ноутбук Конспект
Неделя 20
Лекция: Фильтр Калмана. Запись Конспект
Семинар: Подготовка к экзамену. Запись Конспект
Контрольная работа
Вариант 2022 [https://github.com/Pyatachokk/hse_ts_course/blob/master/2021-spring/midterm/solution.pdf Решение
Экзамен
Домашние задания
Общие правила
Домашние задания сдаются в энитаск. Инвайт был выслан в групповой чат.
Мягких дедлайнов нет. Все дедлайны жёсткие.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.
Студент имеет право два раза за курс просрочить дедлайн по любому из ДЗ (практическому или теоретическому) на 24 часа без штрафа. Или можно просрочить одно ДЗ на 48 часов. Студенты, ни разу не воспользовавшиеся этой возможностью, смогут получить почтовую открытку от семинариста.
В задачах на визуализацию все графики должны иметь оси/заголовки и прочие обязательные атрибуты. При их отсутствии графики оцениваться не будут.
Практические задания
Домашнее задание 1
Обработка данных. Визуализация. Использование стандартных моделей машинного обучения. Генерация признаков. Стратегии прогнозирования.
Выдается: 04.02.2023 19.30
Дедлайн: 18.02.2023 23.59
Домашнее задание 2
Обработка данных. Визуализация. Использование стандартных моделей машинного обучения. Генерация признаков. Стратегии прогнозирования.
Выдается: 23.02.2023 17.00
Дедлайн: 11.03.2023 23.59
Домашнее задание 3
SARIMA
Выдается: 16.04.2023 23.00
Дедлайн: 30.04.2023 23.59
Домашнее задание 4
Многомерная оценка риска
Выдается: 14.05.2023 01.00
Дедлайн: 304.06.2023 23.59
Теоретические задания
Домашнее задание