Машинное обучение в экономических исследованиях 2024-2025 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Домашнее задание)
(Домашнее задание 2)
Строка 33: Строка 33:
 
Информация об оформлении и формате сдачи домашней работы указана в тексте задания.
 
Информация об оформлении и формате сдачи домашней работы указана в тексте задания.
  
'''Консультация о генерации данных''':
+
'''Консультация о генерации данных 2023-2024''':
  
 
* [https://colab.research.google.com/drive/15l0cILQJZdi3RXKScGG8K0jjbLtbcS5G?usp=sharing Код консультации]
 
* [https://colab.research.google.com/drive/15l0cILQJZdi3RXKScGG8K0jjbLtbcS5G?usp=sharing Код консультации]

Версия 18:34, 13 октября 2024

Содержание

Материалы для повторения

Викистранички курсов по теории вероятностей и математической статистике:

Видео про применение python в математической статистике:

Информация о курсе

Оценка = 0.01 * ДЗ1 + 0.29 * ДЗ2 + 0.7 * Экзамен

Слайды

Домашнее задание

Домашнее задание 1

Дедлайн: 1-е декабря

Необходимо внести данные группы (до трех человек включительно), в которой будет выполняться второе домашнее задание, в таблицу.

Домашнее задание 2

Дедлайн: 15-е декабря

Информация об оформлении и формате сдачи домашней работы указана в тексте задания.

Консультация о генерации данных 2023-2024:

Экзамен

Пример экзамена с решением

Экзамен 2023-2024 с решениями

Неделя 1. Байесовские сети

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. FOML глава 6.

2. MLPP глава 10.

Неделя 2. Метод ближайших соседей

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. FOML глава 5.

2. MLPP глава 16.

Неделя 3. Деревья

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. FOML глава 4.

Неделя 4. Логистическая регрессия и метод опорных векторов

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. FOML глава 7.

2. MLPP главы 8 и 14.5.

Дополнительные материалы

1. Статья, в которой был предложен градиентный бустинг

Неделя 5. Машинное обучение в эконометрике

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. HBE глава 29.

Дополнительные материалы

1. Двойное машинное обучение в R

2. Двойное машинное обучение в STATA

3. Двойное машинное обучение в python.

4. Видео лекции о теории двойного машинного обучения от создателя метода

5. Видео лекции о программной реализации двойного машинного обучения от создателей пакета

Примечание: пакеты в R и python разработаны одними и теми же людьми, поэтому практически идентичны. Однако, в статье про пакет в R все расписано гораздо подробней и понятней, с большим числом наглядных примеров и наиболее важными теоретическими выкладками.

Неделя 6. Эффекты воздействия

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. MLPP главы 16.5 и 28.

2. HBE главы 12.34 и 29.22.

Дополнительные материалы

Простое, но достаточно подробное введение в causal inference.

Теория оценивания LATE с использованием дополнительных регрессоров

Неделя 7. Нейронные сети

Основные материалы

Слайды лекции

Код семинара

Рекомендуемая литература

1. MLPP главы 16.5 и 28.

Дополнительные материалы

1. Статья, в которой был предложен метод исключения (dropout).

Неделя 8. Рекуррентные нейронные сети

Основные материалы

Слайды лекции

Код семинара

Неделя 9. Большие языковые модели

Основные материалы

Код лекции

Код семинара

Неделя 10. Повторение

Консультация на лекции

Консультация на семинаре

Список литературы

  1. FOML -- Fundamentals of machine learning for predictive data analytics. John D. Kelleher, Brian Mac Namee, Aoife D'Arcy. Низкая сложность
  2. HBE -- Econometrics. Hansen B. Средняя сложность
  3. MLPP -- Machine learning a probabilistic perspective. Kevin P. Murphy. Высокая сложность