Машинное обучение (ФЭН) - 2022-2023 — различия между версиями
Murrcha (обсуждение | вклад) (→Экзамен) |
Murrcha (обсуждение | вклад) (→Лекции) |
||
Строка 99: | Строка 99: | ||
== Лекции == | == Лекции == | ||
− | Материалы лекций: https://github.com/Murcha1990/ | + | Материалы лекций: https://github.com/Murcha1990/ML_econom_2022-2023/tree/main/Лекции |
− | + | '''Лекция 1 (когда)'' Введение в машинное обучение. | [ссылка на материалы на гитхабе] | |
− | + | ||
− | + | ||
− | + | ||
− | ''' | + | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
== Семинары == | == Семинары == |
Версия 10:24, 29 августа 2022
Содержание
О курсе
Преподаватели:
Лекции - Кантонистова Елена Олеговна
Семинары - Кантонистова Елена, Максимовская Анастасия, Конюшенко Юлия
Лекции и семинары
Канал курса: https://t.me/https://t.me/ml_econom_22
Лекции проводятся [где, когда]
Все материалы лекций и семинаров находятся здесь: https://github.com/Murcha1990/ML_econom_2022-2023
Как связаться с преподавателями и куда сдавать домашки
Группа | Ссылка | Преподаватель | Учебный ассистент | Инвайт в anytask | Чат в telegram |
[когда] | [где] | [телеграм Елена Кантонистова] | [телеграм Алена] | [инвайт] | [ссылка Чат МО ФЭН1] |
[когда] | [где] | [телеграм Анастасия Максимовская] | [телеграм Алена] | [инвайт] | [ссылка Чат МО ФЭН2] |
[когда] | [где] | [телеграм Юлия Конюшенко] | [телеграм Алена] | [инвайт] | [ссылка Чат МО ФЭН3] |
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- самостоятельные работы на семинарах (пятиминутки);
- коллоквиум в сессию первого модуля (письменный);
- домашние задания (в том числе соревнование на Kaggle);
- экзамен в сессию второго модуля (письменный).
Все работы оцениваются в 10 баллов.
Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:
0.35 * Домашнее задание + 0.2 * Коллоквиум + 0.2 * Работа на семинаре + 0.25 * Экзамен
- Активная работа на семинаре добавляет +3 балла к следующей пятиминутке (максимум за пятиминутку в любом случае 10 баллов).
- 20% слушателей с наибольшим накопленным баллом получают накопленный балл автоматом.
Коллоквиум
Коллоквиум будет проходить в сессию первого модуля [дата, время]
В письменной форме (на листочке).
Общая информация:
- Коллоквиум рассчитан на 75 минут (1 час 15 мин), еще 5 минут у вас будет на проверку написанного и сдачу листочков.
- Коллоквиум оценивается в 10 баллов и весит 20% от итоговой оценки за курс.
- Если мы заподозрим, что вы списали, то и вы, и человек, поделившийся решением, получаете 0 баллов. В случае, если вы не согласны с обвинениями в списывании, вы можете защитить работу устно: в этом случае мы спросим решение абсолютно любого задания из вашей работы, а также можем попросить решить похожее задание не из варианта коллоквиума.
Описание заданий:
- В заданиях 1 и 2 (с выбором вариантов ответа) необходимо указать варианты ответов, которые считаете верными, а также кратко обосновать, почему указанные варианты ответов верные, а остальные - нет.
- В задании 3 (теоретическое без выбора ответа) необходимо дать максимально подробный и развёрнутый ответ.
- В задании 4 (задача или пример) необходимо максимально подробно изложить ваши рассуждения и привести вычисления.
- В задании 5 (задание на написание кода) старайтесь писать понятный код с интерпретируемыми обозначениями и названиями. Код пишется на листочке с комментариями. За ошибки в синтаксисе баллы НЕ снижаем.
Подготовительный вариант вы можете посмотреть здесь: https://docs.google.com/document/d/1xErmREQt0z9ab5plpMO_AYSv0xZtXi7rwcwMi5rZUw4/edit
Мы проведём консультацию к коллоквиуму онлайн и запишем её, запись выложим [тут].
Экзамен
Экзамен пройдёт [где, когда]. Для студентов, которые по объективным и подтверждённым причинам не могут писать экзамен в основной день, резервное время - [где, когда].
Экзамен будет состоять из 3-х частей:
- Части A (тестовая с вариантами ответа) на 2.5 балла с 16-ю заданиями равного веса
- Части B (задачи без вариантов ответа) на 3.5 балла с 6-ю заданиями равного веса
- Части C (работа с набором данных) на 4 балла с заданиями индивидуального веса
Пройдет экзамен на платформе online.hse.ru, на его выполнение будет дано 80 мин. Пожалуйста, убедитесь, что вы подключены к курсу по этой ссылке: [ссылка]
Шкала перевода первичных баллов за тест в оценку за экзамен:
- [6; 10] -> 10 баллов
- [5.4; 6.0) - 9
- [4.8; 5.4) - 8
- [4.2; 4.8) - 7
- [3.6; 4.2) - 6
- [3; 3.6) - 5
- [2.4; 3) - 4
- [0; 2.4) - неуд.
По усмотрению преподавателей курса критерии перевода баллов могут быть смягчены после оценки общего результата по всем студентам
Обращаем ваше внимание на то, что в тесте могут быть вопросы, не изучавшиеся в рамках курса. Это компенсируется тем, что для получения максимальной оценки можно выполнить далеко не все задания (таким образом, если вы не можете решить что-то по программе настоящего курса, у вас есть возможность "отыграться" за счёт внепрограммных вопросов).
Во время написания экзамена можно пользоваться всеми материалами курса, а также средой программирования на Python (рекомендуем подготовить её перед экзаменом, чтобы не терять время).
Задания 1-4 (1.75 первичных балла суммарно) внутри части C будут целиком на pandas, для выполнения заданий 5-6 необходимо будет воспользоваться библиотекой scikit-learn.
Лекции
Материалы лекций: https://github.com/Murcha1990/ML_econom_2022-2023/tree/main/Лекции
'Лекция 1 (когда) Введение в машинное обучение. | [ссылка на материалы на гитхабе]
Семинары
Материалы семинаров: https://github.com/Murcha1990/ML_Econom_2021-2022/tree/main/Семинары
Общий плейлист видео с семинаров и лекций: YouTube
Семинар 1. Основы линейной алгебры и матричного дифференцирования | GitHub
Семинар 2. Линейная регрессия. Обучения и валидация качества модели | GitHub
Семинар 3. Вывод оптимальных констант некоторых функций потерь. Обсуждение предобработки данных | GitHub
Семинар 4. Задача бинарной классификации, Подготовка данных. | GitHub
Семинар 5. Решение задач классификации. Подбор гиперпараметров | GitHub
Семинар 6. Логистическая регрессия. SVM. AUC-ROC | GitHub
Семинар 7. Обсуждение feature extraction и feature selection | GitHub
Семинар 8. Решающие деревья | GitHub
Семинар 9. Случайный лес и компромисс между смещением и разбросом | GitHub
Семинар 10. Градиентный бустинг. Часть 1 | GitHub
Семинар 11. Градиентный бустинг. Часть 2 | GitHub
Семинар 12. Кластеризация | GitHub
Семинар 13. Временные ряды. Поиск выбросов и аномалий | GitHub
Домашние задания
На курсе планируется 7 домашних заданий, а будет 6. Формула вычисления итоговой оценки: взвешенное среднее из 6 5 домашних заданий с максимальными баллами.
Каждое домашнее задание имеет индивидуальный вес, который будет появляться одновременно с появлением очередного домашнего задания.
Все домашние работы, а также пятиминутки в начале семинаров необходимо сдавать в Anytask.
Домашняя работа 1. Линейная регрессия и векторное дифференцирование | Дедлайн - 29 сентября в 23:59
Домашняя работа 2. ML Pipeline | Дедлайн - 13 октября в 23:59
Домашняя работа 3. Модели классификации и оценка их качества | Дедлайн - 31 октября в 23:59 7 ноября в 23:59
Домашняя работа 4. kNN, DecisionTree, RandomForest, SGD classifier | Дедлайн - 25 ноября в 23:59
Домашняя работа 5. Kaggle InClass - Fraud Detection | Дедлайн - 13 декабря в 23:59
Домашняя работа 6. Бустинг. Снижение размерности | Дедлайн - 11 декабря в 23:59
Полезные материалы
Книги
- Hastie T., Tibshirani R, Friedman J. The Elements of Statistical Learning (2nd edition). Springer, 2009.r, 2009.
- Bishop C. M. Pattern Recognition and Machine Learning. Springer, 2006.
- Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. MIT Press, 2012.
- Murphy K. Machine Learning: A Probabilistic Perspective. MIT Press, 2012.
- Mohammed J. Zaki, Wagner Meira Jr. Data Mining and Analysis. Fundamental Concepts and Algorithms. Cambridge University Press, 2014.
- Willi Richert, Luis Pedro Coelho. Building Machine Learning Systems with Python. Packt Publishing, 2013.