Машинное обучение в экономике бакалавриат 2024-2025 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Домашнее задание 2)
(Экзамен)
 
(не показано 38 промежуточных версии этого же участника)
Строка 23: Строка 23:
 
'''Дедлайн''': 18 мая
 
'''Дедлайн''': 18 мая
  
Необходимо внести данные группы (до трех человек включительно), в которой будет выполняться второе домашнее задание, в таблицу.
+
Необходимо внести данные группы (до трех человек включительно), в которой будет выполняться второе домашнее задание, в таблицу по [https://docs.google.com/spreadsheets/d/1MLeXqpQ-q-FVzRM0NjVsAzKPrOmjxJzpNWLxGEzB5cM/edit?usp=sharing ссылке].
  
 
=== Домашнее задание 2 ===  
 
=== Домашнее задание 2 ===  
Строка 29: Строка 29:
 
'''Дедлайн''': 1 июня
 
'''Дедлайн''': 1 июня
  
Информация об оформлении и формате сдачи домашней работы указана в тексте задания.
+
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%94%D0%BE%D0%BC%D0%B0%D1%88%D0%BD%D0%B5%D0%B5%20%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5%20%D0%9C%D0%9E%20%D0%91%D0%90%D0%9A%202024-2025.pdf Текст задания]
  
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%94%D0%BE%D0%BC%D0%B0%D1%88%D0%BD%D0%B5%D0%B5_%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5__%D0%9C%D0%9E__%D0%91%D0%90%D0%9A__%D0%9E%D0%9D%D0%9B%D0%90%D0%99%D0%9D__2024_2025.pdf Домашнее задание]
+
== Экзамен ==
  
'''Консультация о генерации данных 2023-2024''':
+
'''Дата''': будет объявлена позже
  
* [https://colab.research.google.com/drive/15l0cILQJZdi3RXKScGG8K0jjbLtbcS5G?usp=sharing Код консультации]
+
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%20%D0%B4%D0%BE%D1%81%D1%80%D0%BE%D1%87%D0%BD%D1%8B%D0%B9.pdf Информация о досрочно экзамене]
* [https://youtu.be/B5w5HPFkbTo Видео, часть 1]
+
* [https://youtu.be/PFbkJITNa7A Видео, часть 2]
+
  
== Экзамен ==
+
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/Экзамен%20МО%20Бакалавриат%202024-2025.pdf Решение экзамена]
 
+
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%20%D0%9C%D0%9E%20%D0%91%D0%B0%D0%BA%D0%B0%D0%BB%D0%B0%D0%B2%D1%80%D0%B8%D0%B0%D1%82%20%D0%9E%D0%BD%D0%BB%D0%B0%D0%B9%D0%BD%202024-2025.pdf Условие экзамена]
+
  
 
=== Экзамены прошлых лет ===
 
=== Экзамены прошлых лет ===
  
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%92%D1%81%D1%82%D1%83%D0%BF%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5%20%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5.%20%D0%9C%D0%9E.%202023-2024.pdf Пример экзамена с решением 2023-2024]
+
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%92%D1%81%D1%82%D1%83%D0%BF%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5%20%D0%B7%D0%B0%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5.%20%D0%9C%D0%9E.%202023-2024.pdf Первый пример экзамена с решениями 2023-2024, бакалавриат]
  
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD.%20%D0%9C%D0%9E.%202023-2024.pdf Экзамен 2023-2024 с решениями]
+
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD.%20%D0%9F%D1%80%D0%B5%D0%B4%D0%B2%D0%B0%D1%80%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9.%20%D0%9C%D0%9E.%202023-2024.pdf Второй пример экзамена с решениями, 2023-2024, бакалавриат]
 +
 
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD.%20%D0%9C%D0%9E.%202023-2024.pdf Экзамен 2023-2024 с решениями, бакалавриат]
  
 
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%20%D0%9C%D0%9E%20%D0%9C%D0%B0%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%82%D1%83%D1%80%D0%B0%202024-2025%20%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D0%B5.pdf Экзамен 2024-2025 с решениями, магистратура]
 
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD%20%D0%9C%D0%9E%20%D0%9C%D0%B0%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%82%D1%83%D1%80%D0%B0%202024-2025%20%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D0%B5.pdf Экзамен 2024-2025 с решениями, магистратура]
 +
 +
== Консультации ==
 +
 +
=== Консультация перед экзаменом на лекции 2023-2024 ===
 +
*[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%9A%D0%BE%D0%BD%D1%81%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%86%D0%B8%D1%8F.%20%D0%9C%D0%9E.%202023-2024.pdf Задачи]
 +
*[https://youtu.be/chChWaDkYEI Видео 1]
 +
*[https://youtu.be/si0jgqis1fY Видео 2]
 +
*[https://youtu.be/ET47Z_r9B98 Видео 3]
 +
*[https://youtu.be/m8Crj5Nh_20 Видео 4]
 +
 +
=== Консультация о генерации данных для домашней работы 2023-2024 ===
 +
 +
* [https://colab.research.google.com/drive/15l0cILQJZdi3RXKScGG8K0jjbLtbcS5G?usp=sharing Код консультации]
 +
* [https://youtu.be/B5w5HPFkbTo Видео, часть 1]
 +
* [https://youtu.be/PFbkJITNa7A Видео, часть 2]
  
 
== Неделя 0. Введение в машинное обучение ==
 
== Неделя 0. Введение в машинное обучение ==
 +
 +
=== Основные материалы ===
  
 
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/Лекция%200.%20Введение%20в%20машинное%20обучение.pdf Слайды лекции]
 
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/Лекция%200.%20Введение%20в%20машинное%20обучение.pdf Слайды лекции]
Строка 62: Строка 77:
  
 
[https://colab.research.google.com/drive/1Iq1zomLp2kZ1kAffPeFyzHFtdvhbuTR2?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1Iq1zomLp2kZ1kAffPeFyzHFtdvhbuTR2?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%201.%20%D0%91%D0%B0%D0%B9%D0%B5%D1%81%D0%BE%D0%B2%D1%81%D0%BA%D0%B8%D0%B5%20%D1%81%D0%B5%D1%82%D0%B8.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 76: Строка 93:
  
 
[https://colab.research.google.com/drive/1a2sgrKj_ap58JKRixlG2xvopTmV7dU_8?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1a2sgrKj_ap58JKRixlG2xvopTmV7dU_8?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%202.%20%D0%9C%D0%B5%D1%82%D0%BE%D0%B4%20%D0%B1%D0%BB%D0%B8%D0%B6%D0%B0%D0%B9%D1%88%D0%B8%D1%85%20%D1%81%D0%BE%D1%81%D0%B5%D0%B4%D0%B5%D0%B9.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 90: Строка 109:
  
 
[https://colab.research.google.com/drive/1vXOMuDUFSxqO4XFpvvcpf4SWokIx4Lk9?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1vXOMuDUFSxqO4XFpvvcpf4SWokIx4Lk9?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%203.%20%D0%A0%D0%B5%D1%88%D0%B0%D1%8E%D1%89%D0%B8%D0%B5%20%D0%B4%D0%B5%D1%80%D0%B5%D0%B2%D1%8C%D1%8F.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 102: Строка 123:
  
 
[https://colab.research.google.com/drive/1vqEDTOwBGkz0mEM4i4SPxHvVRrJfTjmy?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1vqEDTOwBGkz0mEM4i4SPxHvVRrJfTjmy?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%204.%20%D0%9B%D0%BE%D0%B3%D0%B8%D1%81%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F%20%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D1%8F%20%D0%B8%20%D0%B3%D1%80%D0%B0%D0%B4%D0%B8%D0%B5%D0%BD%D1%82%D0%BD%D1%8B%D0%B9%20%D0%B1%D1%83%D1%81%D1%82%D0%B8%D0%BD%D0%B3.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 120: Строка 143:
  
 
[https://colab.research.google.com/drive/11ss8xdr6B3FPeIExktOZ90GFzGAS7mq5?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/11ss8xdr6B3FPeIExktOZ90GFzGAS7mq5?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%205.%20%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5%20%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5%20%D0%B2%20%D1%8D%D0%BA%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%BA%D0%B5.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 146: Строка 171:
  
 
[https://colab.research.google.com/drive/1uFqihpgQxbPw61kz3N2icOzqPGeK_H-d?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1uFqihpgQxbPw61kz3N2icOzqPGeK_H-d?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%206.%20%D0%AD%D1%84%D1%84%D0%B5%D0%BA%D1%82%D1%8B%20%D0%B2%D0%BE%D0%B7%D0%B4%D0%B5%D0%B9%D1%81%D1%82%D0%B2%D0%B8%D1%8F.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 168: Строка 195:
  
 
[https://colab.research.google.com/drive/1QuoHICOPZNfj3Z0ZpYC248zRAwqDSXfU?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1QuoHICOPZNfj3Z0ZpYC248zRAwqDSXfU?usp=sharing Код семинара]
 +
 +
[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%A1%D0%B5%D0%BC%D0%B8%D0%BD%D0%B0%D1%80%207.%20%D0%9D%D0%B5%D0%B9%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B5%20%D1%81%D0%B5%D1%82%D0%B8.pdf Задачи семинара]
  
 
=== Рекомендуемая литература ===
 
=== Рекомендуемая литература ===
Строка 184: Строка 213:
  
 
[https://colab.research.google.com/drive/1R--ZslnpKE47FAk9X4I8YefqZm0sIn2J?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/1R--ZslnpKE47FAk9X4I8YefqZm0sIn2J?usp=sharing Код семинара]
 +
 +
[https://colab.research.google.com/drive/1-pXQi7FqvXT_NmQafbKF6bmmk1PSEMQ2?usp=sharing Код лекции]
  
 
== Неделя 9. Большие языковые модели ==
 
== Неделя 9. Большие языковые модели ==
Строка 192: Строка 223:
  
 
[https://colab.research.google.com/drive/12CwGbEFp0nBiRJnKJIppdKDio8PBsJQW?usp=sharing Код семинара]
 
[https://colab.research.google.com/drive/12CwGbEFp0nBiRJnKJIppdKDio8PBsJQW?usp=sharing Код семинара]
 
== Неделя 10. Повторение ==
 
 
=== Консультация на лекции ===
 
*[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%9A%D0%BE%D0%BD%D1%81%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%86%D0%B8%D1%8F.%20%D0%9C%D0%9E.%202023-2024.pdf Задачи]
 
*[https://youtu.be/chChWaDkYEI Видео 1]
 
*[https://youtu.be/si0jgqis1fY Видео 2]
 
*[https://youtu.be/ET47Z_r9B98 Видео 3]
 
*[https://youtu.be/m8Crj5Nh_20 Видео 4]
 
 
=== Консультация на семинаре ===
 
 
*[https://github.com/bogdanpotanin/Machine-Learning/blob/main/%D0%AD%D0%BA%D0%B7%D0%B0%D0%BC%D0%B5%D0%BD.%20%D0%9F%D1%80%D0%B5%D0%B4%D0%B2%D0%B0%D1%80%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9.%20%D0%9C%D0%9E.%202023-2024.pdf Задачи]
 
  
 
= Список литературы =
 
= Список литературы =
  
# '''FOML''' -- [https://www.amazon.com/Fundamentals-Machine-Learning-Predictive-Analytics/dp/0262029448 Fundamentals of machine learning for predictive data analytics. John D. Kelleher, Brian Mac Namee, Aoife D'Arcy.] '''Низкая сложность'''
+
# '''FOML''' - [https://www.amazon.com/Fundamentals-Machine-Learning-Predictive-Analytics/dp/0262029448 Fundamentals of machine learning for predictive data analytics. John D. Kelleher, Brian Mac Namee, Aoife D'Arcy.] '''Низкая сложность'''
# '''HBE''' -- [https://www.amazon.com/Econometrics-Bruce-Hansen/dp/0691235899 Econometrics. Hansen B.] '''Средняя сложность'''
+
# '''HBE''' - [https://www.amazon.com/Econometrics-Bruce-Hansen/dp/0691235899 Econometrics. Hansen B.] '''Средняя сложность'''
# '''CMLE''' -- [https://causalml-book.org/assets/chapters/CausalML_book.pdf Applied Causal Inference Powered by ML and AI. V. Chernozhukov, C. Hansen, N. Kallus, M. Spindler, V. Syrgkanis] '''Средняя сложность'''
+
# '''CMLE''' - [https://causalml-book.org Applied Causal Inference Powered by ML and AI. V. Chernozhukov, C. Hansen, N. Kallus, M. Spindler, V. Syrgkanis] '''Средняя сложность'''
# '''MLPP''' -- [https://www.amazon.com/Machine-Learning-Probabilistic-Perspective-Computation/dp/0262018020 Machine learning a probabilistic perspective. Kevin P. Murphy.] '''Высокая сложность'''
+
# '''MLPP''' - [https://www.amazon.com/Machine-Learning-Probabilistic-Perspective-Computation/dp/0262018020 Machine learning a probabilistic perspective. Kevin P. Murphy.] '''Высокая сложность'''

Текущая версия на 12:13, 3 июля 2025

Содержание

Материалы для повторения

Викистранички курсов по теории вероятностей и математической статистике:

Видео про применение python в математической статистике:

Информация о курсе

Оценка = 0.01 * ДЗ1 + 0.29 * ДЗ2 + 0.7 * Экзамен

Домашнее задание

Домашнее задание 1

Дедлайн: 18 мая

Необходимо внести данные группы (до трех человек включительно), в которой будет выполняться второе домашнее задание, в таблицу по ссылке.

Домашнее задание 2

Дедлайн: 1 июня

Текст задания

Экзамен

Дата: будет объявлена позже

Информация о досрочно экзамене

Решение экзамена

Экзамены прошлых лет

Первый пример экзамена с решениями 2023-2024, бакалавриат

Второй пример экзамена с решениями, 2023-2024, бакалавриат

Экзамен 2023-2024 с решениями, бакалавриат

Экзамен 2024-2025 с решениями, магистратура

Консультации

Консультация перед экзаменом на лекции 2023-2024

Консультация о генерации данных для домашней работы 2023-2024

Неделя 0. Введение в машинное обучение

Основные материалы

Слайды лекции

Неделя 1. Байесовские сети

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. FOML глава 6.

2. MLPP глава 10.

Неделя 2. Метод ближайших соседей

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. FOML глава 5.

2. MLPP глава 16.

Неделя 3. Деревья

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. FOML глава 4.

Неделя 4. Логистическая регрессия и метод опорных векторов

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. FOML глава 7.

2. MLPP главы 8 и 14.5.

Дополнительные материалы

1. Статья, в которой был предложен градиентный бустинг

Неделя 5. Машинное обучение в эконометрике

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. HBE глава 29.

Дополнительные материалы

1. Двойное машинное обучение в R

2. Двойное машинное обучение в STATA

3. Двойное машинное обучение в python.

4. Видео лекции о теории двойного машинного обучения от создателя метода

5. Видео лекции о программной реализации двойного машинного обучения от создателей пакета

Примечание: пакеты в R и python разработаны одними и теми же людьми, поэтому практически идентичны. Однако, в статье про пакет в R все расписано гораздо подробней и понятней, с большим числом наглядных примеров и наиболее важными теоретическими выкладками.

Неделя 6. Эффекты воздействия

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. MLPP главы 16.5 и 28.

2. HBE главы 12.34 и 29.22.

Дополнительные материалы

Простое, но достаточно подробное введение в causal inference.

Теория оценивания LATE с использованием дополнительных регрессоров

Примеры использования машинного обучения для оценивания эффектов воздействия в прикладных исследованиях

Неделя 7. Нейронные сети

Основные материалы

Слайды лекции

Код семинара

Задачи семинара

Рекомендуемая литература

1. MLPP главы 16.5 и 28.

Дополнительные материалы

1. Статья, в которой был предложен метод исключения (dropout).

Неделя 8. Рекуррентные нейронные сети

Основные материалы

Слайды лекции

Код семинара

Код лекции

Неделя 9. Большие языковые модели

Основные материалы

Код лекции

Код семинара

Список литературы

  1. FOML - Fundamentals of machine learning for predictive data analytics. John D. Kelleher, Brian Mac Namee, Aoife D'Arcy. Низкая сложность
  2. HBE - Econometrics. Hansen B. Средняя сложность
  3. CMLE - Applied Causal Inference Powered by ML and AI. V. Chernozhukov, C. Hansen, N. Kallus, M. Spindler, V. Syrgkanis Средняя сложность
  4. MLPP - Machine learning a probabilistic perspective. Kevin P. Murphy. Высокая сложность