Моделирование временных рядов 2023/24 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 57: Строка 57:
 
# (Борис) ADF-тест.  
 
# (Борис) ADF-тест.  
 
# (Борис) ETS как частный случай ARIMA. Выбор между моделями.  
 
# (Борис) ETS как частный случай ARIMA. Выбор между моделями.  
# (Борис) Введение в байесовский анализ. Prophet. DLT.
 
 
# (Матвей) RNN, LSTM, GRU.  
 
# (Матвей) RNN, LSTM, GRU.  
 
# (Матвей) Attention. Трансформеры.  
 
# (Матвей) Attention. Трансформеры.  
 +
# (Борис) Введение в байесовский анализ. Prophet. DLT.
 +
# (Матвей/Борис) Байесовская оптимизация. Гауссовские процессы.
 
# (Борис) GARCH-модель.  
 
# (Борис) GARCH-модель.  
 
# (Борис) Правдоподобие GARCH-модели
 
# (Борис) Правдоподобие GARCH-модели
 
# (Борис) Копулы.
 
# (Борис) Копулы.
# (Матвей/Борис) Гауссовские процессы. Байесовская оптимизация.
 
 
# (Матвей) Многомерные модели. VAR. SVAR. IRF.
 
# (Матвей) Многомерные модели. VAR. SVAR. IRF.
 
# (Матвей) Иерархические модели.  
 
# (Матвей) Иерархические модели.  

Версия 21:46, 7 декабря 2023

О курсе

Курс по выбору для студентов для студентов 3 курса в 3-4 модулях.

Лектор: Демешев Борис Борисович

Лекции проходят онлайн

Ссылка:

Семинарист: Зехов Матвей Сергеевич

Семинары проходят онлайн

Ссылка:

Итоговая оценка за курс

ДЗ = 0.2 * ДЗ_1 + 0.2 * ДЗ_2 + 0.2 * ДЗ_3 + 0.2 * ДЗ_4 + 0.2 * ДЗ_теор.

Накоп. = ⅔ * ДЗ + ⅓ * КР

Итог = Округление(0.75 * Накоп. + 0.25 * Экз.)

где ДЗ_i — оценка за i-е практическое ДЗ, ДЗ_теор. – оценка за теоретическое ДЗ, КР — оценка за контрольную работу, Накоп. — накопленная оценка. Экз. — оценка за экзамен.

Округление арифметическое.

Автоматы

Всем студентам может быть автоматом выставлена оценка за экзамен, равная Минимум(7,Накоп.). Итоговая оценка будет рассчитана по стандартной формуле. При явке на экзамен эта возможность аннулируется.

Дополнительные условия

  • При невозможности выполнения любого из ДЗ по уважительной причине и при наличии соответствующей справки, студент вправе перенести вес ДЗ на Экзамен. Для этого необходимо передать справку в учебную часть, а также уведомить семинариста.
  • При пропуске КР по уважительной причине вес КР переносится на Экзамен. Автомат в таком случае не может быть выставлен.

Полезные ссылки

Телеграм-чат курса

Гитхаб курса

[ Таблица с оценками]

Задачник

Лекции

  1. (Борис) Различные задачи на рядах. Общее про ряды: сезонность, цикличность, тренд. Создание признаков. Лаг, идея растущего и идея скользящего окна.
  2. (Борис) LOESS-регрессия. Интенсивность тренда. STL-разложение. MSTL-разложение.
  3. (Борис) ETS-модель. Правдоподобие ETS-модели.
  4. (Борис) Мультипликативные ETS-модели. Информационный критерий Акаике. Дивергенция Кульбака-Лейблера.
  5. (Борис) Детерминированные процессы. Теорема Вольда. Белый шум. MA-процесс. Оператор лага. Автокорреляция и частная автокорреляция.
  6. (Борис) Разница между процессом и уравнением. AR(p)-процесс. Стационарные решения AR(p)-уравнения.
  7. (Борис) ARMA, ARIMA, SARIMA, KPSS-тест.
  8. (Борис) ADF-тест.
  9. (Борис) ETS как частный случай ARIMA. Выбор между моделями.
  10. (Матвей) RNN, LSTM, GRU.
  11. (Матвей) Attention. Трансформеры.
  12. (Борис) Введение в байесовский анализ. Prophet. DLT.
  13. (Матвей/Борис) Байесовская оптимизация. Гауссовские процессы.
  14. (Борис) GARCH-модель.
  15. (Борис) Правдоподобие GARCH-модели
  16. (Борис) Копулы.
  17. (Матвей) Многомерные модели. VAR. SVAR. IRF.
  18. (Матвей) Иерархические модели.
  19. (Матвей) Классификация временных рядов. DTW.
  20. (Матвей/Борис) Если останется время. Фильтр Калмана.

Семинары

  1. Вспомнить всё! Основные понятия математической статистики в контексте временных рядов. Задача линейной регрессии. Метод максимального правдоподобия. Статистические свойства оценок. Тестирование гипотез. Загрузка и обработка данных с датами. Периодические и непериодические данные. Основные особенности строения временных рядов. Автокорреляции и частные автокорреляции.
  2. Обработка пропусков. LOESS-регрессия. STL-разложение. Инжиниринг фичей и использование стандартных регрессоров sklearn. Многошаговое прогнозирование. Прямая и рекурсивная стратегии многошагового прогнозирования.
  3. Модели экспоненциального сглаживания. Модели Хольта-Винтерса. Модели ETS.
  4. Примеры оценки ETS-моделей на данных. Общий алгоритм работы с временными рядами.
  5. Стационарные процессы. Процессы белого шума. Тестирование данных на наличие серийных автокорреляций. MA(q)-процесс. Вывод теоретических ACF и PACF. Прогнозирование среднего и дисперсии MA(q)-процесса.
  6. AR(p)-процесс. Корреляционные характеристики AR(p)-процесса. Прогнозирование среднего и дисперсии AR(p)-процесса.
  7. Детерминированный и стохастический тренд. Порядок интеграции. ARIMA(p,d,q)-процесс.
  8. Обзор основных соревнований по временным рядам.
  9. Введение в оценку риска. Value-at-Risk. Expected shortfall. Исторический и параметрический подходы.
  10. ARCH-GARCH. Filtered Historical Simulation.
  11. Оценка риска портфеля. Базовые модели. Совместные распределения и ядровая оценка плотности.
  12. Гауссовские процессы.
  13. Байесовская оптимизация.
  14. IRF. SVAR. Иерархические модели.
  15. Классификация временных рядов.
  16. Prophet. DLT (Orbit).

Контрольная работа

Вариант 2022 [https://github.com/Pyatachokk/hse_ts_course/blob/master/2021-spring/midterm/solution.pdf Решение

Вариант 2021

Экзамен

Вариант 2022

Вариант 2021

Домашние задания

Общие правила

Домашние задания сдаются в энитаск. Инвайт был выслан в групповой чат.

Мягких дедлайнов нет. Все дедлайны жёсткие.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Студент имеет право два раза за курс просрочить дедлайн по любому из ДЗ (практическому или теоретическому) на 24 часа без штрафа. Или можно просрочить одно ДЗ на 48 часов. Студенты, ни разу не воспользовавшиеся этой возможностью, смогут получить почтовую открытку от семинариста.

В задачах на визуализацию все графики должны иметь оси/заголовки и прочие обязательные атрибуты. При их отсутствии графики оцениваться не будут.


Практические задания

Домашнее задание 1

Обработка данных. Визуализация. Использование стандартных моделей машинного обучения. Генерация признаков. Стратегии прогнозирования.

Выдается: 04.02.2023 19.30

Дедлайн: 18.02.2023 23.59

Задание

Данные


Домашнее задание 2

Обработка данных. Визуализация. Использование стандартных моделей машинного обучения. Генерация признаков. Стратегии прогнозирования.

Выдается: 23.02.2023 17.00

Дедлайн: 11.03.2023 23.59

Задание

Данные 1

Данные 2


Домашнее задание 3

SARIMA

Выдается: 16.04.2023 23.00

Дедлайн: 30.04.2023 23.59

Задание

Данные


Домашнее задание 4

Многомерная оценка риска

Выдается: 14.05.2023 01.00

Дедлайн: 304.06.2023 23.59

Задание

Теоретические задания

Домашнее задание