Машинное обучение на больших данных 2020 — различия между версиями
A (обсуждение | вклад) (Контакты семинаристов и ассистентов) |
A (обсуждение | вклад) |
||
Строка 42: | Строка 42: | ||
Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций. | Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций. | ||
+ | |||
При необходимости, можно писать на почту или в Telegram: | При необходимости, можно писать на почту или в Telegram: | ||
+ | |||
Анатолий - @sindb | Анатолий - @sindb | ||
+ | |||
Алексей - @adkosm | Алексей - @adkosm | ||
+ | |||
Шариф - @shedx | Шариф - @shedx | ||
Версия 22:53, 31 января 2020
Содержание
О курсе
Курс читается для студентов 4-го курса ПМИ ФКН ВШЭ в 3 модуле. Проводится с 2017 года.
Лектор: Зимовнов Андрей Вадимович
Лекции ПМИ проходят по четвергам, 10:30 - 11:50, ауд. R407.
Вычислительные мощности в облаке Azure для курса предоставила компания Microsoft.
Полезные ссылки
Репозиторий с материалами на GitHub
Самостоятельные задачи здаются в Dropbox. Для каждого семинара своя отдельная ссылка на прием заданий:
- Семинар 1. MapReduce. - https://www.dropbox.com/request/DxQZg2jEwvTQxmUnmIdh
- Семинар 2. Hadoop MapReduce. - https://www.dropbox.com/request/4zMflMWC7YogYvbXeOP4
- To be continued...
Канал в telegram для объявлений: https://t.me/joinchat/AAAAAFj8HdBYgd79RDeQpg
Заметки с семинаров (там же указываются задачи для самостоятельного решения) - https://github.com/ADKosm/lsml-seminars-2020-public
Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github.
Семинары
Группа | Преподаватель | Время | Аудитория |
---|---|---|---|
МОП 161 | Бардуков Анатолий Андреевич | Четверг 12:10-13:30 | M302 |
МОП 162 | Космачев Алексей Дмитриевич | Среда 10:30-11:50 | M202 |
Ассистенты: Анвардинов Шариф Ринатович
Консультации
Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.
При необходимости, можно писать на почту или в Telegram:
Анатолий - @sindb
Алексей - @adkosm
Шариф - @shedx
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные задания, выдаваемые на каждом семинаре. Дедлайн на сдачу заданий - 2 недели с момента проведения семинара. Не включая день семинара через две недели.
- Практическое домашнее задание (будет выдано ориентировочно на 3 семинаре).
- Письменный экзамен.
Итоговая оценка вычисляется:
Oитоговая = 0.5* Oдомашка + 0.2 * Oсам. раб. + 0.3 * Оэкзамен
Автомат возможен при высоких оценках за практическое домашнее задание и решенные самостоятельные задания.
Правила сдачи заданий
На каждое домашнее задание каждому студенту отводится ~500$ для работы в облаке Azure. Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами.
Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
Лекции
Лекция 1. Введение. Hadoop MR, Spark. Ссылка на слайды лекции
To be continued...
Практические задания
TBD.
Экзамен
Дата: ?
Место: ?
Вопросы к экзамену: ?
Полезные материалы
Книги
- Ron Bekkerman, Mikhail Bilenko, John Langford. Scaling up Machine Learning: Parallel and Distributed Approaches, Cambridge University Press, 2011.
- Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets, Cambridge University Press, 2014.
- Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series), The MIT Press, 2016.
- Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. Advanced Analytics with Spark: Patterns for Learning from Data at Scale, O'Reilly Media, 2015.