Моделирование временных рядов 2023/24 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «== О курсе == Курс по выбору для студентов для студентов 3 курса в 3-4 модулях. '''Лектор:''' Де…»)
 
Строка 46: Строка 46:
 
[https://github.com/bdemeshev/ts_pset Задачник]
 
[https://github.com/bdemeshev/ts_pset Задачник]
  
== Бортовой журнал ==
+
== Лекции ==
  
==== Неделя 1 ====
+
# Различные задачи на рядах. Общее про ряды: сезонность, цикличность, тренд. Создание признаков. Лаг, идея растущего и идея скользящего окна.
  
'''Лекция''': Различные задачи на рядах. Общее про ряды: сезонность, цикличность, тренд. Создание признаков. Лаг, идея растущего и идея скользящего окна. [https://youtu.be/ceupfkBm7wo Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_01.pdf Конспект]
+
# LOESS-регрессия. Интенсивность тренда. STL-разложение. MSTL-разложение.
  
'''Семинар''': Вспомнить всё! Основные понятия математической статистики в контексте временных рядов. Задача линейной регрессии. Метод максимального правдоподобия. Статистические свойства оценок. Тестирование гипотез. Загрузка и обработка данных с датами. Периодические и непериодические данные. Основные особенности строения временных рядов. Автокорреляции и частные автокорреляции. [https://youtu.be/KRMwtWUrurU Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_00.ipynb Ноутбук 1] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_01.ipynb Ноутбук 2]
+
# ETS-модель. Правдоподобие ETS-модели.
  
==== Неделя 2 ====
+
# Мультипликативные ETS-модели. Информационный критерий Акаике. Дивергенция Кульбака-Лейблера.
  
'''Лекция''': LOESS-регрессия. Интенсивность тренда. STL-разложение. MSTL-разложение. [https://youtu.be/C_wzKSkdI1s Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_02.pdf Конспект] [https://ocw.mit.edu/courses/economics/14-385-nonlinear-econometric-analysis-fall-2007/lecture-notes/local_lin_reg.pdf Статья про LOESS] [http://www.gardner.fyi/blog/STL-Part-II/ STL простым языком] [http://www.wessa.net/download/stl.pdf Оригинальная статья про STL] [https://otexts.com/fpp3/stlfeatures.html Фичи STL]
+
# Детерминированные процессы. Теорема Вольда. Белый шум. MA-процесс. Оператор лага. Автокорреляция и частная автокорреляция.
  
'''Семинар''': Обработка пропусков. LOESS-регрессия. STL-разложение. Инжиниринг фичей и использование стандартных регрессоров sklearn. Многошаговое прогнозирование. Прямая и рекурсивная стратегии многошагового прогнозирования. [https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.375.7885&rep=rep1&type=pdf Хорошая статья про стратегии] [https://youtu.be/WZ5mtEN90Uo Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_02.ipynb Ноутбук]
+
# Разница между процессом и уравнением. AR(p)-процесс. Стационарные решения AR(p)-уравнения.
  
==== Неделя 3 ====
+
# ARMA, ARIMA, SARIMA, KPSS-тест.
  
'''Лекция''': ETS-модель. Правдоподобие ETS-модели. [https://youtu.be/WQov0suf_mI Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_03.pdf Конспект]
+
# ADF-тест. ETS как частный случай ARIMA. Выбор между моделями.  
  
'''Семинар''': Модели экспоненциального сглаживания. Модели Хольта-Винтерса. Модели ETS. [https://youtu.be/d1E9aYRyBcQ Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_03.pdf Конспект] [https://otexts.com/fpp3/expsmooth.html Глава книги Хиндмана]
+
#  GARCH-модель.  
  
==== Неделя 4 ====
+
# Копулы.
  
'''Лекция''': Мультипликативные ETS-модели. Информационный критерий Акаике. Дивергенция Кульбака-Лейблера. [https://youtu.be/2zdmI7rgqys Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_04.pdf Конспект]
+
# Копулы (продолжение). Правдоподобие GARCH-модели.  
  
'''Семинар''': Примеры оценки ETS-моделей на данных. Общий алгоритм работы с временными рядами. [https://youtu.be/tfwU75tIZ9o Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_04.ipynb Ноутбук]
+
# Гауссовские процессы.  
  
==== Неделя 5 ====
+
# Байесовская оптимизация. Многомерные модели. VAR.
  
'''Лекция''': Детерминированные процессы. Теорема Вольда. Белый шум. MA-процесс. Оператор лага. Автокорреляция и частная автокорреляция. [https://youtu.be/5vWy_tk8UxY Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_05.pdf Конспект]
+
# VAR.  
  
'''Семинар''': Стационарные процессы. Процессы белого шума. Тестирование данных на наличие серийных автокорреляций. MA(q)-процесс. Вывод теоретических ACF и PACF. Прогнозирование среднего и дисперсии MA(q)-процесса. [https://youtu.be/a75iWEiQ7Jg Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_05.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_05.pdf Конспект]
+
# Иерархические модели.  
  
==== Неделя 6 ====
+
# Классификация временных рядов. DTW.
  
'''Лекция''': Разница между процессом и уравнением. AR(p)-процесс. Стационарные решения AR(p)-уравнения. [https://youtu.be/AAsHAWJbt5w Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_06.pdf Конспект]
+
# Введение в байесовский анализ. Prophet. DLT.
  
'''Семинар''':  AR(p)-процесс. Корреляционные характеристики AR(p)-процесса. Прогнозирование среднего и дисперсии AR(p)-процесса. [https://www.youtube.com/watch?v=iQ89o2pTNFo&list=PLHPTLBeVYc8xL4BtpaC4SpgKhKjoQhkIn&index=12 Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_06.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_06.pdf Конспект]
+
# Фильтр Калмана.
  
==== Неделя 7 ====
+
== Семинары ==
  
'''Лекция''': ARMA, ARIMA, SARIMA, KPSS-тест. [https://youtu.be/ZMVyTS4Yjlo Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_07.pdf Конспект]
+
# Вспомнить всё! Основные понятия математической статистики в контексте временных рядов. Задача линейной регрессии. Метод максимального правдоподобия. Статистические свойства оценок. Тестирование гипотез. Загрузка и обработка данных с датами. Периодические и непериодические данные. Основные особенности строения временных рядов. Автокорреляции и частные автокорреляции.
  
'''Семинар''': Детерминированный и стохастический тренд. Порядок интеграции. ARIMA(p,d,q)-процесс. [https://youtu.be/sU5ZrpEHTdk Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_07.pdf Конспект]
+
# Обработка пропусков. LOESS-регрессия. STL-разложение. Инжиниринг фичей и использование стандартных регрессоров sklearn. Многошаговое прогнозирование. Прямая и рекурсивная стратегии многошагового прогнозирования.  
  
==== Неделя 8 ====
+
# Модели экспоненциального сглаживания. Модели Хольта-Винтерса. Модели ETS.
  
'''Лекция''':  Пропуск
+
# Примеры оценки ETS-моделей на данных. Общий алгоритм работы с временными рядами. [
  
'''Семинар''': Обзор основных соревнований по временным рядам. [https://youtu.be/80I76-ErimI Запись]
+
# Стационарные процессы. Процессы белого шума. Тестирование данных на наличие серийных автокорреляций. MA(q)-процесс. Вывод теоретических ACF и PACF. Прогнозирование среднего и дисперсии MA(q)-процесса.
  
==== Неделя 9 ====
+
# AR(p)-процесс. Корреляционные характеристики AR(p)-процесса. Прогнозирование среднего и дисперсии AR(p)-процесса.
  
'''Лекция''':  ADF-тест. ETS как частный случай ARIMA. Выбор между моделями. [https://youtu.be/Zyrj7gzrU78 Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_08.pdf Конспект]
+
# Детерминированный и стохастический тренд. Порядок интеграции. ARIMA(p,d,q)-процесс.  
  
'''Семинар''': Подготовка к КР. [https://youtu.be/9-x1EblC2HE Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_09.pdf Конспект]
+
# Обзор основных соревнований по временным рядам.
  
==== Неделя 10 ====
+
# Введение в оценку риска. Value-at-Risk. Expected shortfall. Исторический и параметрический подходы.
  
'''Лекция''': Подготовка к КР. [https://youtu.be/GUPtU0mnAjk Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_09.pdf Конспект]
+
# ARCH-GARCH. Filtered Historical Simulation.
  
'''Семинар''': Введение в оценку риска. Value-at-Risk. Expected shortfall. Исторический и параметрический подходы. [https://youtu.be/4kJ8k1toVQE Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_10_1.ipynb Ноутбук 1] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_10_2.ipynb Ноутбук 2]
+
# Оценка риска портфеля. Базовые модели. Совместные распределения и ядровая оценка плотности.
  
==== Неделя 11 ====
+
# Гауссовские процессы.
  
'''Лекция''': GARCH-модель. [https://youtu.be/OwTD3R-E63c Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_10.pdf Конспект]
+
# Байесовская оптимизация.
  
'''Семинар''': КР
+
# IRF. SVAR. Иерархические модели.
  
==== Неделя 12 ====
+
# Классификация временных рядов.
  
'''Лекция''': Копулы. [https://youtu.be/XhgzQvY9Z4Q Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_11.pdf Конспект]
+
# Prophet. DLT (Orbit).
 
+
'''Семинар''': ARCH-GARCH. Filtered Historical Simulation. [https://youtu.be/It3w0Rz7sGg Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_11.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_11.pdf Конспект]
+
 
+
==== Неделя 13 ====
+
 
+
'''Лекция''': Копулы (продолжение). Правдоподобие GARCH-модели. [https://youtu.be/CJauTJtCd2k Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_12.pdf Конспект]
+
 
+
'''Семинар''': Оценка риска портфеля. Базовые модели. Совместные распределения и ядровая оценка плотности. [https://youtu.be/uN6-HpT6JwU Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_12.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_12.pdf Конспект]
+
 
+
==== Неделя 14 ====
+
 
+
'''Лекция''': Гауссовские процессы. [https://youtu.be/YEawdX3OyWc Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_14.pdf Конспект]
+
 
+
'''Семинар''':  Гауссовские процессы. [https://youtu.be/4gvV_IUJSwY Запись]
+
[https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_13.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_13.pdf Презентация]
+
 
+
==== Неделя 15 ====
+
 
+
'''Лекция''': Байесовская оптимизация. Многомерные модели. VAR. [https://youtu.be/lFKIWGtMbc8 Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_14.pdf Конспект]
+
 
+
'''Семинар''': Байесовская оптимизация. [https://youtu.be/-xv5awgpi6Y Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_14.ipynb Ноутбук]  [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_14.pdf Конспект]
+
 
+
==== Неделя 16 ====
+
 
+
'''Лекция''': VAR. [https://youtu.be/7Ft5LXb8Z3s Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_15.pdf Конспект]
+
 
+
'''Семинар''': Никто не пришёл. /Грустный тромбон/
+
 
+
==== Неделя 17 ====
+
 
+
'''Лекция''': Иерархические модели. [https://youtu.be/47GsKhrqsHM Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_16.pdf Конспект]
+
 
+
'''Семинар''': IRF. SVAR. Иерархические модели. [https://youtu.be/DiVQt0yFEAM Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_16_01.ipynb Ноутбук 1] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_16_02.ipynb Ноутбук 2] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_16_03.ipynb Ноутбук 3] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_16.pdf Конспект]
+
 
+
==== Неделя 18 ====
+
 
+
'''Лекция''': Классификация временных рядов. DTW. [https://youtu.be/2LdNsjEKt1E Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_17.pdf Конспект]
+
 
+
'''Семинар''': Классификация временных рядов. [https://youtu.be/i9I_vvb8Wj0 Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_17.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_17.pdf Конспект]
+
 
+
==== Неделя 19 ====
+
 
+
'''Лекция''': Введение в байесовский анализ. Prophet. DLT. [https://youtu.be/woydHkJioQU Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_18.pdf Конспект]
+
 
+
'''Семинар''': Prophet. DLT (Orbit). [https://youtu.be/vRMY0o96HeM Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_18.ipynb Ноутбук] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_18.pdf Конспект]
+
 
+
==== Неделя 20 ====
+
 
+
'''Лекция''': Фильтр Калмана. [https://youtu.be/xZOik9MFxno Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/lectures/lecture_19.pdf Конспект]
+
 
+
'''Семинар''': Подготовка к экзамену. [https://youtu.be/huDREi-MdWA Запись] [https://github.com/Pyatachokk/hse_ts_course/blob/master/2023-spring/seminars/sem_19.pdf Конспект]
+
  
 
== Контрольная работа ==
 
== Контрольная работа ==

Версия 14:43, 7 декабря 2023

О курсе

Курс по выбору для студентов для студентов 3 курса в 3-4 модулях.

Лектор: Демешев Борис Борисович

Лекции проходят онлайн

Ссылка:

Семинарист: Зехов Матвей Сергеевич

Семинары проходят онлайн

Ссылка:

Итоговая оценка за курс

ДЗ = 0.2 * ДЗ_1 + 0.2 * ДЗ_2 + 0.2 * ДЗ_3 + 0.2 * ДЗ_4 + 0.2 * ДЗ_теор.

Накоп. = ⅔ * ДЗ + ⅓ * КР

Итог = Округление(0.75 * Накоп. + 0.25 * Экз.)

где ДЗ_i — оценка за i-е практическое ДЗ, ДЗ_теор. – оценка за теоретическое ДЗ, КР — оценка за контрольную работу, Накоп. — накопленная оценка. Экз. — оценка за экзамен.

Округление арифметическое.

Автоматы

Всем студентам может быть автоматом выставлена оценка за экзамен, равная Минимум(7,Накоп.). Итоговая оценка будет рассчитана по стандартной формуле. При явке на экзамен эта возможность аннулируется.

Дополнительные условия

  • При невозможности выполнения любого из ДЗ по уважительной причине и при наличии соответствующей справки, студент вправе перенести вес ДЗ на Экзамен. Для этого необходимо передать справку в учебную часть, а также уведомить семинариста.
  • При пропуске КР по уважительной причине вес КР переносится на Экзамен. Автомат в таком случае не может быть выставлен.

Полезные ссылки

Телеграм-чат курса

Гитхаб курса

[ Таблица с оценками]

Задачник

Лекции

  1. Различные задачи на рядах. Общее про ряды: сезонность, цикличность, тренд. Создание признаков. Лаг, идея растущего и идея скользящего окна.
  1. LOESS-регрессия. Интенсивность тренда. STL-разложение. MSTL-разложение.
  1. ETS-модель. Правдоподобие ETS-модели.
  1. Мультипликативные ETS-модели. Информационный критерий Акаике. Дивергенция Кульбака-Лейблера.
  1. Детерминированные процессы. Теорема Вольда. Белый шум. MA-процесс. Оператор лага. Автокорреляция и частная автокорреляция.
  1. Разница между процессом и уравнением. AR(p)-процесс. Стационарные решения AR(p)-уравнения.
  1. ARMA, ARIMA, SARIMA, KPSS-тест.
  1. ADF-тест. ETS как частный случай ARIMA. Выбор между моделями.
  1. GARCH-модель.
  1. Копулы.
  1. Копулы (продолжение). Правдоподобие GARCH-модели.
  1. Гауссовские процессы.
  1. Байесовская оптимизация. Многомерные модели. VAR.
  1. VAR.
  1. Иерархические модели.
  1. Классификация временных рядов. DTW.
  1. Введение в байесовский анализ. Prophet. DLT.
  1. Фильтр Калмана.

Семинары

  1. Вспомнить всё! Основные понятия математической статистики в контексте временных рядов. Задача линейной регрессии. Метод максимального правдоподобия. Статистические свойства оценок. Тестирование гипотез. Загрузка и обработка данных с датами. Периодические и непериодические данные. Основные особенности строения временных рядов. Автокорреляции и частные автокорреляции.
  1. Обработка пропусков. LOESS-регрессия. STL-разложение. Инжиниринг фичей и использование стандартных регрессоров sklearn. Многошаговое прогнозирование. Прямая и рекурсивная стратегии многошагового прогнозирования.
  1. Модели экспоненциального сглаживания. Модели Хольта-Винтерса. Модели ETS.
  1. Примеры оценки ETS-моделей на данных. Общий алгоритм работы с временными рядами. [
  1. Стационарные процессы. Процессы белого шума. Тестирование данных на наличие серийных автокорреляций. MA(q)-процесс. Вывод теоретических ACF и PACF. Прогнозирование среднего и дисперсии MA(q)-процесса.
  1. AR(p)-процесс. Корреляционные характеристики AR(p)-процесса. Прогнозирование среднего и дисперсии AR(p)-процесса.
  1. Детерминированный и стохастический тренд. Порядок интеграции. ARIMA(p,d,q)-процесс.
  1. Обзор основных соревнований по временным рядам.
  1. Введение в оценку риска. Value-at-Risk. Expected shortfall. Исторический и параметрический подходы.
  1. ARCH-GARCH. Filtered Historical Simulation.
  1. Оценка риска портфеля. Базовые модели. Совместные распределения и ядровая оценка плотности.
  1. Гауссовские процессы.
  1. Байесовская оптимизация.
  1. IRF. SVAR. Иерархические модели.
  1. Классификация временных рядов.
  1. Prophet. DLT (Orbit).

Контрольная работа

Вариант 2022 [https://github.com/Pyatachokk/hse_ts_course/blob/master/2021-spring/midterm/solution.pdf Решение

Вариант 2021

Экзамен

Вариант 2022

Вариант 2021

Домашние задания

Общие правила

Домашние задания сдаются в энитаск. Инвайт был выслан в групповой чат.

Мягких дедлайнов нет. Все дедлайны жёсткие.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Студент имеет право два раза за курс просрочить дедлайн по любому из ДЗ (практическому или теоретическому) на 24 часа без штрафа. Или можно просрочить одно ДЗ на 48 часов. Студенты, ни разу не воспользовавшиеся этой возможностью, смогут получить почтовую открытку от семинариста.

В задачах на визуализацию все графики должны иметь оси/заголовки и прочие обязательные атрибуты. При их отсутствии графики оцениваться не будут.


Практические задания

Домашнее задание 1

Обработка данных. Визуализация. Использование стандартных моделей машинного обучения. Генерация признаков. Стратегии прогнозирования.

Выдается: 04.02.2023 19.30

Дедлайн: 18.02.2023 23.59

Задание

Данные


Домашнее задание 2

Обработка данных. Визуализация. Использование стандартных моделей машинного обучения. Генерация признаков. Стратегии прогнозирования.

Выдается: 23.02.2023 17.00

Дедлайн: 11.03.2023 23.59

Задание

Данные 1

Данные 2


Домашнее задание 3

SARIMA

Выдается: 16.04.2023 23.00

Дедлайн: 30.04.2023 23.59

Задание

Данные


Домашнее задание 4

Многомерная оценка риска

Выдается: 14.05.2023 01.00

Дедлайн: 304.06.2023 23.59

Задание

Теоретические задания

Домашнее задание