НИС Машинное обучение и приложения — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Создана новая страница курса)
 
Строка 30: Строка 30:
  
 
''Полезные ссылки:'' [http://habrahabr.ru/post/217545/ 1], [http://www.statease.com/news/news0612.pdf 2], [http://blog.asmartbear.com/data-interpretation-mistakes.html 3], [https://sunlightfoundation.com/blog/2013/02/19/avoiding-data-mistakes/ 4], [http://www.ma.utexas.edu/users/mks/statmistakes/StatisticsMistakes.html 5], [http://sites.stat.psu.edu/~lsimon/stat250/fa99/slides/mistakes/mistakes.PPT 6], [http://gking.harvard.edu/files/mist.pdf 7]
 
''Полезные ссылки:'' [http://habrahabr.ru/post/217545/ 1], [http://www.statease.com/news/news0612.pdf 2], [http://blog.asmartbear.com/data-interpretation-mistakes.html 3], [https://sunlightfoundation.com/blog/2013/02/19/avoiding-data-mistakes/ 4], [http://www.ma.utexas.edu/users/mks/statmistakes/StatisticsMistakes.html 5], [http://sites.stat.psu.edu/~lsimon/stat250/fa99/slides/mistakes/mistakes.PPT 6], [http://gking.harvard.edu/files/mist.pdf 7]
 +
 +
'''Семинар 4. Линейная регрессия.'''
 +
 +
''В докладе следует осветить следующие основные моменты:''
 +
 +
# Общую постановка задачи обучения с учителем, а также регрессии как ее частный случай
 +
# Привести несколько примеров из жизни, где подобная задача возникает
 +
# Рассмотреть линейную модель регресии, а также привести пример любой нелинейной модели
 +
# Записать задачу оптимизации, которая возникает при использовании квадратичной функции потерь.
 +
# Вывести разложение квадратичной ошибки в виде суммы bias и variance, обсудить значение этого разложения
 +
# Показать хотя бы два метода для решения данной задачи - метод градиентного спуска и псевдо-решение СЛАУ, обсудить, какие преимущества и недостатки есть у каждого метода.
 +
# Рассмотреть пример переобучения и использования L2-регуляризации как метода борьбы с ним. Связь L2-регуляризации с нормальным псевдо-решением.
 +
# Обсудить другие функции потерь, например, L1.
 +
 +
''Полезные ссылки:'' [http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение_%28курс_лекций%2C_К.В.Воронцов%29 1], [http://statweb.stanford.edu/~tibs/ElemStatLearn/ 2] (главы 2 и 3), [http://research.microsoft.com/en-us/um/people/cmbishop/PRML/ 3], [https://www.cs.ubc.ca/~murphyk/MLbook/ 4], [http://scott.fortmann-roe.com/docs/BiasVariance.html 5], [http://web.engr.oregonstate.edu/~xfern/classes/cs534/notes/Linear-Regression-3-11.pdf 6], [http://eniac.cs.qc.cuny.edu/andrew/gcml/lecture5.pdf 7], [http://cs229.stanford.edu/notes/cs229-notes1.pdf 8]

Версия 18:11, 8 октября 2015

Таблица с расписание семинаров здесь

Контакты:

Просьба к теме письма добавлять тег [НИС ФКН].

Краткое описание

В ходе курса студенты изучат теоретические основы машинного обучения и получат практические навыки применения методов поиска скрытых закономерностей в данных. Также студенты получат опыт самостоятельного разбора научной литературы, который пригодится им при написании курсовых, дипломных и научных работ.

Темы семинаров

Семинар 1. Машинное обучение и история его развития.

Семинар 2. Научный метод.

Основные моменты: Что такое научный метод? Его основные особенности. Эмпирическое и теоретический научный метод. Принципы верификации и фальсификации. Бритва Оккама. Научный и ненаучный метод. Псевдонаука.

Полезные ссылки: 1, 2, 3 + глава 22 из Гарри Поттера и методов рацмышления

Семинар 3.1. Как сделать качественную презентацию.

Полезные ссылки: 1, 2, 3, 4, 5, 6, 7

Семинар 3.2. Как не нужно работать с данными.

Полезные ссылки: 1, 2, 3, 4, 5, 6, 7

Семинар 4. Линейная регрессия.

В докладе следует осветить следующие основные моменты:

  1. Общую постановка задачи обучения с учителем, а также регрессии как ее частный случай
  2. Привести несколько примеров из жизни, где подобная задача возникает
  3. Рассмотреть линейную модель регресии, а также привести пример любой нелинейной модели
  4. Записать задачу оптимизации, которая возникает при использовании квадратичной функции потерь.
  5. Вывести разложение квадратичной ошибки в виде суммы bias и variance, обсудить значение этого разложения
  6. Показать хотя бы два метода для решения данной задачи - метод градиентного спуска и псевдо-решение СЛАУ, обсудить, какие преимущества и недостатки есть у каждого метода.
  7. Рассмотреть пример переобучения и использования L2-регуляризации как метода борьбы с ним. Связь L2-регуляризации с нормальным псевдо-решением.
  8. Обсудить другие функции потерь, например, L1.

Полезные ссылки: 1, 2 (главы 2 и 3), 3, 4, 5, 6, 7, 8