Машинное обучение на больших данных 2020 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Добавил актуальную информацию о курсе на 2020 год)
(Контакты семинаристов и ассистентов)
Строка 31: Строка 31:
 
! Группа !! Преподаватель !! Время !! Аудитория
 
! Группа !! Преподаватель !! Время !! Аудитория
 
|-
 
|-
| МОП 161 || Бардуков Анатолий Андреевич || Четверг 12:10-13:30 || R614
+
| МОП 161 || Бардуков Анатолий Андреевич || Четверг 12:10-13:30 || M302
 
|-
 
|-
 
| МОП 162 || Космачев Алексей Дмитриевич || Среда 10:30-11:50 || M202
 
| МОП 162 || Космачев Алексей Дмитриевич || Среда 10:30-11:50 || M202
Строка 42: Строка 42:
  
 
Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.
 
Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.
 +
При необходимости, можно писать на почту или в Telegram:
 +
Анатолий - @sindb
 +
Алексей - @adkosm
 +
Шариф - @shedx
  
 
=== Правила выставления оценок ===
 
=== Правила выставления оценок ===

Версия 22:53, 31 января 2020

О курсе

Курс читается для студентов 4-го курса ПМИ ФКН ВШЭ в 3 модуле. Проводится с 2017 года.

Лектор: Зимовнов Андрей Вадимович

Лекции ПМИ проходят по четвергам, 10:30 - 11:50, ауд. R407.

Вычислительные мощности в облаке Azure для курса предоставила компания Microsoft.

Полезные ссылки

Репозиторий с материалами на GitHub

Самостоятельные задачи здаются в Dropbox. Для каждого семинара своя отдельная ссылка на прием заданий:

Канал в telegram для объявлений: https://t.me/joinchat/AAAAAFj8HdBYgd79RDeQpg

Заметки с семинаров (там же указываются задачи для самостоятельного решения) - https://github.com/ADKosm/lsml-seminars-2020-public

Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github.

Семинары

Группа Преподаватель Время Аудитория
МОП 161 Бардуков Анатолий Андреевич Четверг 12:10-13:30 M302
МОП 162 Космачев Алексей Дмитриевич Среда 10:30-11:50 M202

Ассистенты: Анвардинов Шариф Ринатович

Консультации

Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций. При необходимости, можно писать на почту или в Telegram: Анатолий - @sindb Алексей - @adkosm Шариф - @shedx

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Самостоятельные задания, выдаваемые на каждом семинаре. Дедлайн на сдачу заданий - 2 недели с момента проведения семинара. Не включая день семинара через две недели.
  • Практическое домашнее задание (будет выдано ориентировочно на 3 семинаре).
  • Письменный экзамен.

Итоговая оценка вычисляется:

Oитоговая = 0.5* Oдомашка + 0.2 * Oсам. раб. + 0.3 * Оэкзамен

Автомат возможен при высоких оценках за практическое домашнее задание и решенные самостоятельные задания.

Правила сдачи заданий

На каждое домашнее задание каждому студенту отводится ~500$ для работы в облаке Azure. Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами.

Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

Лекции

Лекция 1. Введение. Hadoop MR, Spark. Ссылка на слайды лекции

To be continued...

Практические задания

TBD.

Экзамен

Дата: ?

Место: ?

Вопросы к экзамену: ?

Полезные материалы

Книги

  1. Ron Bekkerman, Mikhail Bilenko, John Langford. Scaling up Machine Learning: Parallel and Distributed Approaches, Cambridge University Press, 2011.
  2. Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets, Cambridge University Press, 2014.
  3. Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series), The MIT Press, 2016.
  4. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. Advanced Analytics with Spark: Patterns for Learning from Data at Scale, O'Reilly Media, 2015.