Машинное обучение на больших данных 2020 — различия между версиями
Kris ros (обсуждение | вклад) (Новая страница: «== О курсе == Курс читается для студентов 3-го курса [https://cs.hse.ru/ami ПМИ ФКН ВШЭ] в 4 модуле. Про…») |
Adkosmos (обсуждение | вклад) (Добавил актуальную информацию о курсе на 2020 год) |
||
Строка 1: | Строка 1: | ||
== О курсе == | == О курсе == | ||
− | Курс читается для студентов | + | Курс читается для студентов 4-го курса [https://cs.hse.ru/ami ПМИ ФКН ВШЭ] в 3 модуле. Проводится с 2017 года. |
'''Лектор:''' [https://www.hse.ru/org/persons/175396509 Зимовнов Андрей Вадимович] | '''Лектор:''' [https://www.hse.ru/org/persons/175396509 Зимовнов Андрей Вадимович] | ||
− | Лекции ПМИ проходят по | + | Лекции ПМИ проходят по четвергам, 10:30 - 11:50, ауд. R407. |
− | + | ||
− | + | ||
Вычислительные мощности в облаке Azure для курса предоставила компания Microsoft. | Вычислительные мощности в облаке Azure для курса предоставила компания Microsoft. | ||
Строка 13: | Строка 11: | ||
=== Полезные ссылки === | === Полезные ссылки === | ||
− | [https://github.com/ZEMUSHKA/ | + | [https://github.com/ZEMUSHKA/lsml_hse_lectures Репозиторий с материалами на GitHub] |
− | + | Самостоятельные задачи здаются в Dropbox. Для каждого семинара своя отдельная ссылка на прием заданий: | |
− | + | * Семинар 1. MapReduce. - https://www.dropbox.com/request/DxQZg2jEwvTQxmUnmIdh | |
+ | * Семинар 2. Hadoop MapReduce. - https://www.dropbox.com/request/4zMflMWC7YogYvbXeOP4 | ||
+ | * To be continued... | ||
− | + | Канал в telegram для объявлений: https://t.me/joinchat/AAAAAFj8HdBYgd79RDeQpg | |
− | + | Заметки с семинаров (там же указываются задачи для самостоятельного решения) - https://github.com/ADKosm/lsml-seminars-2020-public | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github. | Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github. | ||
Строка 33: | Строка 29: | ||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
− | ! Группа !! Преподаватель !! | + | ! Группа !! Преподаватель !! Время !! Аудитория |
|- | |- | ||
− | | МОП | + | | МОП 161 || Бардуков Анатолий Андреевич || Четверг 12:10-13:30 || R614 |
|- | |- | ||
− | | МОП | + | | МОП 162 || Космачев Алексей Дмитриевич || Среда 10:30-11:50 || M202 |
|- | |- | ||
− | |||
− | |||
|} | |} | ||
− | Ассистенты: Анвардинов Шариф Ринатович | + | Ассистенты: Анвардинов Шариф Ринатович |
=== Консультации === | === Консультации === | ||
Строка 52: | Строка 46: | ||
В курсе предусмотрено несколько форм контроля знания: | В курсе предусмотрено несколько форм контроля знания: | ||
− | * | + | * Самостоятельные задания, выдаваемые на каждом семинаре. Дедлайн на сдачу заданий - 2 недели с момента проведения семинара. Не включая день семинара через две недели. |
− | * Письменный экзамен | + | * Практическое домашнее задание (будет выдано ориентировочно на 3 семинаре). |
+ | * Письменный экзамен. | ||
− | Итоговая оценка вычисляется | + | Итоговая оценка вычисляется: |
− | O<sub>итоговая</sub> = 0. | + | O<sub>итоговая</sub> = 0.5* O<sub>домашка</sub> + 0.2 * O<sub>сам. раб.</sub> + 0.3 * О<sub>экзамен</sub> |
− | + | Автомат возможен при высоких оценках за практическое домашнее задание и решенные самостоятельные задания. | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
=== Правила сдачи заданий === | === Правила сдачи заданий === | ||
− | На каждое домашнее задание каждому студенту отводится ~ | + | На каждое домашнее задание каждому студенту отводится ~500$ для работы в облаке Azure. |
− | + | Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами. | |
Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются. | Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются. | ||
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента. | При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента. | ||
− | |||
− | |||
== Лекции == | == Лекции == | ||
− | '''Лекция 1''' | + | '''Лекция 1.''' Введение. Hadoop MR, Spark. [https://github.com/ZEMUSHKA/lsml_hse_lectures/blob/master/lecture1.pdf Ссылка на слайды лекции] |
− | + | To be continued... | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
== Практические задания == | == Практические задания == | ||
− | + | TBD. | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
== Экзамен == | == Экзамен == | ||
− | Дата: | + | Дата: ? |
Место: ? | Место: ? | ||
− | Вопросы к экзамену: | + | Вопросы к экзамену: ? |
== Полезные материалы == | == Полезные материалы == |
Версия 22:39, 31 января 2020
Содержание
О курсе
Курс читается для студентов 4-го курса ПМИ ФКН ВШЭ в 3 модуле. Проводится с 2017 года.
Лектор: Зимовнов Андрей Вадимович
Лекции ПМИ проходят по четвергам, 10:30 - 11:50, ауд. R407.
Вычислительные мощности в облаке Azure для курса предоставила компания Microsoft.
Полезные ссылки
Репозиторий с материалами на GitHub
Самостоятельные задачи здаются в Dropbox. Для каждого семинара своя отдельная ссылка на прием заданий:
- Семинар 1. MapReduce. - https://www.dropbox.com/request/DxQZg2jEwvTQxmUnmIdh
- Семинар 2. Hadoop MapReduce. - https://www.dropbox.com/request/4zMflMWC7YogYvbXeOP4
- To be continued...
Канал в telegram для объявлений: https://t.me/joinchat/AAAAAFj8HdBYgd79RDeQpg
Заметки с семинаров (там же указываются задачи для самостоятельного решения) - https://github.com/ADKosm/lsml-seminars-2020-public
Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github.
Семинары
Группа | Преподаватель | Время | Аудитория |
---|---|---|---|
МОП 161 | Бардуков Анатолий Андреевич | Четверг 12:10-13:30 | R614 |
МОП 162 | Космачев Алексей Дмитриевич | Среда 10:30-11:50 | M202 |
Ассистенты: Анвардинов Шариф Ринатович
Консультации
Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.
Правила выставления оценок
В курсе предусмотрено несколько форм контроля знания:
- Самостоятельные задания, выдаваемые на каждом семинаре. Дедлайн на сдачу заданий - 2 недели с момента проведения семинара. Не включая день семинара через две недели.
- Практическое домашнее задание (будет выдано ориентировочно на 3 семинаре).
- Письменный экзамен.
Итоговая оценка вычисляется:
Oитоговая = 0.5* Oдомашка + 0.2 * Oсам. раб. + 0.3 * Оэкзамен
Автомат возможен при высоких оценках за практическое домашнее задание и решенные самостоятельные задания.
Правила сдачи заданий
На каждое домашнее задание каждому студенту отводится ~500$ для работы в облаке Azure. Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами.
Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.
При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.
Лекции
Лекция 1. Введение. Hadoop MR, Spark. Ссылка на слайды лекции
To be continued...
Практические задания
TBD.
Экзамен
Дата: ?
Место: ?
Вопросы к экзамену: ?
Полезные материалы
Книги
- Ron Bekkerman, Mikhail Bilenko, John Langford. Scaling up Machine Learning: Parallel and Distributed Approaches, Cambridge University Press, 2011.
- Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets, Cambridge University Press, 2014.
- Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series), The MIT Press, 2016.
- Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. Advanced Analytics with Spark: Patterns for Learning from Data at Scale, O'Reilly Media, 2015.