Прикладная статистика в машинном обучении(2018)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 3-го курса ПМИ ФКН ВШЭ в 1-2 модулях.

Лектора: Артемов Алексей Валерьевич, Деркач Денис Александрович, Шараев Максим Геннадьевич

Лекции проходят по субботам (8, 15, 22, 29 сентября, 6, 13, 20, 27 октября, 3, 10, 17, 24 ноября, 1, 8 декабря), 13:40 - 15:00, ауд. 205.

Полезные ссылки

Телеграм-чат курса: Общая группа курса ПСМО-18/19

Гитхаб курса: hse-stat-course-2018

Anytask курса: anytask

Семинары

Группа Преподаватель Учебный ассистент Расписание инвайт AnyTask
162 (МОП) Кондратьева Екатерина Алексей Хачиянц суббота, 15:10 - 16:30, ауд. 505 nnxckG8
161 (МОП) Белавин Владислав Диана Полонская суббота, 15:10 - 16:30, ауд. 503 1jiNCvR

Отчётность по курсу и критерии оценки

Домашние задания

В рамках курса каждые два занятия будет выдаваться домашняя работа содержащая теоретические и практические задачи по материалам прошедших занятий.

  • На выполнение ДЗ отводится 2 недели. За решения отправленные после дедлайна начисляется 0 баллов.
  • Каждое ДЗ оценивается по шкале от 0 до 10 баллов с шагом в 0.5 баллов.
  • Итоговая оценка за ДЗ считается как среднее арифметическое округленное до ближайшего целого или половинного балла.

Тесты

В начале каждой лекции, начиная со второй, будет проводиться тест по материалам предыдущей недели. Тест состоит из 10 вопросов.

Коллоквиум

За коллоквиум ставится оценка от 0 до 10 баллов с шагом в 0.5. Проводится в форме письменной контрольной.

Дата проведения письменного коллоквиума -- 10 ноября, 13:40-15:00, аудитория 205.

Программа коллоквиума [PDF, 460 КБайт]

Экзамен

Устный экзамен по всем темам модуля оценивается от 0 до 10 баллов с шагом в 0.5.

Итоговая оценка за курс

Итоговая оценка за курс расчитывается по следующей формуле:

Oитог = 0.8 * Oнакопл + 0.2 * Оэкз

Oнакопл = 0.75 * Oдз + 0.125 * Осамост + 0.125 * Околлок

Возможность получить автомат

Если вы:

  • набрали больше или ровно 8 бонусных баллов за ДЗ;
  • посетили больше или ровно 60% лекций;

То вы молодец и получаете право на 8, 9 или 10 автоматом(зависит от Oнакопл :)

Лекции и семинары

Номер Дата Название Материалы
1 8 сентября Введение. Задачи по теории вероятностей и статистике
На занятии будут рассмотрены задачи по различным областям теории вероятностей и статистике для освежения знаний теории вероятностей и статистики у коллег.
Слайды Course Intro Вводный семинар
2 15 сентября Ресемплинг
Моделирование Монте-Карло, бутстреп. Оценка дисперсии на основе бутстрепа. Оценка доверительных интервалов на основе бутстрепа. Метод складного ножа. Множественная проверка гипотез, методы коррекции. Беггинг.
Тест: основы математической статистики.
Слайды Ресэмплинг Семинар по бутстрапу
3 22 сентября Параметрическое оценивание
Метод максимального правдоподобия и его свойства. Дельта-метод. Случай векторного параметра. Доверительное оценивание. Достаточная статистика.
Слайды по оценке параметров
Семинар по оценке параметров
Оценка параметров
4 29 сентября Метрики для сравнения распределений
f-дивергенции, KL дивергенция, метрика Вассерштейна, растояние Йенсена-Шеннона.
Слайды по метрикам Семинар
5 6 октября Проверка гипотез
f-дивергенции, KL дивергенция, метрика Вассерштейна, растояние Йенсена-Шеннона.
Слайды по тестированию гипотез
[Семинар ]

Домашние задания

Все домашние задания сдавать в Anytask курса.

Номер Сроки выполнения Ссылка на условие
1 20 сентября - 5 октября https://github.com/artonson/hse-stat-course-2018/blob/master/homework-handouts/homework-1.pdf
2 10 октября - 24 октября 23:59 https://github.com/artonson/hse-stat-course-2018/blob/master/homework-handouts/homework-2.pdf

Новости курса

[08.09.18] - Первая лекция и семинар объединены и проводятся в 205 аудитории с 13:40 до 16:30.

(В этом разделе публикуется текущая информация по курсу: переносы, изменения в запланированной программе, ...)

Полезные материалы

1. Hastie T., Tibshirani R., Friedman J. The elements of statistical learning: data mining, inference, and prediction. Springer, 2001.

2. Wasserman L. All of Nonparametric Statistics. Springer, 2006.

3. Bishop C.M. Pattern recognition and machine learning. Springer, 2006.

4. David Mackay J.C. Information theory, inference, and learning algorithms. Cambridge, 2007.

5. Grimmett G., Stirzaker D. Probability and Random Processes. Oxford University Press, 2001.

6. Forrester A., Sobester A., Keane A. Engineering Design via Surrogate Modelling. A Practical Guide. Wiley, 2008.

7. Lee J.A., Verleysen M. Nonlinear Dimensionality Reduction. Springer, 2007.

8. Wang G.G., Shan S. Review of Metamodeling Techniques in Support of Engineering Design Optimization // Journal of Mechanical Design, Vol. 129, No. 4, pp. 370-380, 2007.

9. Deconinck, Periaux, Giannakoglou (eds.). Optimization method and tools for multicriteria/multidisciplinary design. Applications to aeronautics and turbomachinary // von Karman Institute for Fluid Dynamics, Lecture Series 2004-07, 2004.

10. Лагутин М.Б. Наглядная математическая статистика. М.: БИНОМ. Лаборатория знаний, 2007.

11. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.

12. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985.

13. Айвазян С.А., Бухштабер В.М., Енюков С.А., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М.: Финансы и статистика, 1989.