Прикладная статистика в машинном обучении 24/25 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
 
(не показано 6 промежуточных версии ещё одного участника)
Строка 1: Строка 1:
(ПОКА ВРЕМЕННАЯ ВЕРСИЯ)
+
''(По причине того, что не успеваем вести вики-страницу и сайт не всегда доступен, все полезные ссылки собраны в телеграм-канале в первом закреплённом сообщении)''
 +
 
 
== О курсе ==
 
== О курсе ==
  
Строка 69: Строка 70:
 
* [https://www.youtube.com/watch?v=uNXx0NrxPmc Видео]
 
* [https://www.youtube.com/watch?v=uNXx0NrxPmc Видео]
 
* [https://github.com/XuMuK1/psmo/blob/2024/lectures/Lec2(Info).pdf Конспект]
 
* [https://github.com/XuMuK1/psmo/blob/2024/lectures/Lec2(Info).pdf Конспект]
 
  
 
'''Лекция 3:''' EM-алгоритм.
 
'''Лекция 3:''' EM-алгоритм.
Строка 86: Строка 86:
 
* [https://www.youtube.com/watch?v=SriwZRFPgw0 Видео]
 
* [https://www.youtube.com/watch?v=SriwZRFPgw0 Видео]
 
* [https://github.com/XuMuK1/psmo/blob/2024/lectures/Lec6(Stat0).pdf Конспект]
 
* [https://github.com/XuMuK1/psmo/blob/2024/lectures/Lec6(Stat0).pdf Конспект]
...
+
 
 +
'''Лекция 7:''' Ранговые критерии (Уилкоксон, Манн-Уитни, Ансари-Брэдли, ранговая корреляция).
 +
 
 +
'''Контрольная'''
 +
 
 +
'''Лекция 8:''' АБ-тестирование.
 +
 
 +
'''Лекция 9:''' Эконометрика. Линейная регрессия при классических предположениях и в гауссовском шуме.
 +
 
 +
'''Лекция 10:''' Эконометрика. Проблемы: мисспецификация, мультиколлинеарность, гетероскедастичность, эндогенность.
 +
 
 +
'''Лекция 11:''' Байесовская статистика или Бутстреп (не утверждено)
  
 
== Семинары ==
 
== Семинары ==
Строка 119: Строка 130:
 
==== ДЗ-1 ====
 
==== ДЗ-1 ====
  
ДЗ-1 состоит из трех частей. Дедлайн по всему ДЗ дд мм гггг 23:59.
+
ДЗ-1 состоит из трех частей. Дедлайн по всему ДЗ: 5 ноября 2024 23:59.
* [ЖДЁМ Часть 1]
+
* [https://github.com/XuMuK1/psmo/blob/2024/homeworks/hw1/Homework_1_part_1.ipynb Часть 1]
 +
* [https://github.com/XuMuK1/psmo/blob/2024/homeworks/hw1/Homework_1_part_2.ipynb Часть 2] [https://github.com/XuMuK1/psmo/blob/2024/homeworks/hw1/moText.txt Данные]
 +
* [https://github.com/XuMuK1/psmo/blob/2024/homeworks/hw1/Homework_1_part_3.ipynb Часть 3]
 
...
 
...
  

Текущая версия на 00:35, 9 декабря 2024

(По причине того, что не успеваем вести вики-страницу и сайт не всегда доступен, все полезные ссылки собраны в телеграм-канале в первом закреплённом сообщении)

О курсе

Курс читается для студентов 3-го курса в 1-2 модулях.

Лектор: Максим Каледин

Семинаристы:

Матвей Зехов

Алексей Ужегов

Михаил Михайлов

Учебные ассистенты: ...

Елисей Шинкарев

Вячеслав Юсупов

Мария Розаева

Динар Саберов

Анастасия Сёмкина

Аркадий Аврамчук

Семинары

(!) Сверяйтесь с вашим актуальным расписанием, возможны изменения.

Группа Семинарист Учебный ассистент
БПМИ221 МОП Матвей Зехов Елисей Шинкарев
БПМИ222 МОП Матвей Зехов Мария Розаева
БПМИ223 МОП Алексей Ужегов Анастасия Сёмкина
БПМИ224 МОП Алексей Ужегов Вячеслав Юсупов
По выбору(кроме онлайн) По выбору(кроме онлайн) Аркадий Аврамчук
Онлайн Михаил Михайлов Динар Саберов

Полезные ссылки

Канал в Телеграме (для важных объявлений) тут

Youtube (записи+прошлый год и ЗВУК) тут

Twitch (Стримы лекций) тут(по расписанию)

Общий чат в Телеграме для обсуждений/вопросов здесь

Лекции

Лекция 1: Метод максимального правдоподобия, свойства ММП-оценок, зависимые наблюдения.

Лекция 2: Теория информации, энтропия и метод максимального правдоподобия.

Лекция 3: EM-алгоритм.

Лекция 4: Фильтр Калмана.

Лекция 5: Оценка параметров фильтра Калмана.

Лекция 6: Стат-0.

Лекция 7: Ранговые критерии (Уилкоксон, Манн-Уитни, Ансари-Брэдли, ранговая корреляция).

Контрольная

Лекция 8: АБ-тестирование.

Лекция 9: Эконометрика. Линейная регрессия при классических предположениях и в гауссовском шуме.

Лекция 10: Эконометрика. Проблемы: мисспецификация, мультиколлинеарность, гетероскедастичность, эндогенность.

Лекция 11: Байесовская статистика или Бутстреп (не утверждено)

Семинары

Семинар 1: Метод максимального правдоподобия.

Семинар 2: Теория информации.

Семинар 3: EM-алгоритм.

Семинар 4: Фильтр Калмана.

Семинар 5: Оценка параметров фильтра Калмана.

Семинар 6: Точечные и интервальные оценки.

...

Домашние задания

Домашние задания представляют из себя python-ноутбук, где потребуется решить несколько теоретических задач, а также несколько задач с помощью программного кода.

Как сдавать ДЗ: Classroom TBA.

Политика дедлайнов: дедлайн задаётся обычно (кроме критических исключений) две недели после релиза последней части ДЗ. Можно сдавать 1 неделю после дедлайна со штрафом 30%, далее сдавать нельзя.

ДЗ-1

ДЗ-1 состоит из трех частей. Дедлайн по всему ДЗ: 5 ноября 2024 23:59.

...

Контрольная работа

Контрольная работа является письменной формой контроля. В контрольную работу войдут задачи по темам примерно до Лекции 8. После недели 8 планируется семинар консультаций и обычная лекция, затем неделя контрольной работы (на лекции) и обычные семинары, потом продолжение в обычном режиме. Возможны изменения, связанные с расписанием и праздниками.

Экзамен

Экзамен является устной формой контроля. В экзамен войдут теория и задачи по темам лекций и семинаров всего курса.

Подробный состав тем и процедура проведения будут объявлены в начале второго модуля.

TBD

Отчётность по курсу и критерии оценки

Итоговая оценка за курс

Итоговая оценка за курс рассчитывается по следующей формуле:

Итог = 0.7*Накоп + 0.3*Максимум(Экз, Минимум(7,Накоп)),

0.7*Накоп= 0.4*Среднее(ДЗ1,ДЗ2,ДЗ3) + 0.3*КР.

Литература

Горяинова Е.Р., Панков А.Р., Платонов Е.Н. Прикладные методы анализа статистических данных – М.: Издательский дом Высшей школы экономики, 2012. (Очень много про непараметрические критерии со ссылками и деталями)

Wasserman L. All of Statistics: A Concise Course in Statistical Inference, Springer Science & Business Media, 2013 (в общем про "большую" статистику)

Чжун К.Л., АитСахлиа Ф. Элементарный курс теории вероятностей. Стохастические процессы и финансовая математика – М.: БИНОМ. Лаборатория знаний, 2014. (если интересно много простых примеров сложных понятий)

Лагутин М.Б. Наглядная математическая статистика – М.: БИНОМ Лаборатория знаний, 2015. (МНОГО МАТСТАТА, но наглядно)


Прочее

  • Frederick Gravetter, Larry Wallnau. Statistics for the Behavioral Sciences – базовый курс с большим количеством картинок и подробных текстовых объяснений. Прекрасно подходит для быстрого повторения интуиции и основной методологии.
  • David Williams. Weighing the Odds. A Course in Probability and Statistics – суровая книжка для самых смелых. Содержит все основные темы по теории вероятностей и статистике в рамках программы для технических специальностей. Сквозная идея книги – показать связь теории вероятностей и статистики с другими разделами математики, поэтому для каждого утверждения приводятся строгие и очень подробные доказательства. Сильно расширяет общематематический кругозор, содержит много нетривиальных утверждений.