LSML 2022/2023

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 4-го курса ПМИ ФКН ВШЭ в 3 модуле. Проводится с 2017 года.

Лектор: Зимовнов Андрей Вадимович

Семинарист: Космачев Алексей Дмитриевич

Ассистент Ваньков Тимур Витальевич

Лекции проходят в онлайн-режиме.

Вычислительные мощности в облаке Yandex.Cloud для курса предоставила компания Яндекс.

Полезные ссылки

Слайды лекций: https://github.com/ZEMUSHKA/lsml_hse_lectures

Получение доступа к Облаку - https://forms.gle/Kmfio76mPWdzrTan7

Таблица с оценками: https://docs.google.com/spreadsheets/d/1O-BXjPsw3Fk9VW3lI1Z-qK0YYKtB5o2g57qfuyW_XRA

Плейлист с записями всех занятий - https://www.youtube.com/watch?v=7amVmvCSrmI&list=PLEwK9wdS5g0qQQBtV4eqrPC9Xiyb2dPjL

Канал в telegram для объявлений: https://t.me/+K6o3PvxfW9xjYmMy

Группа в telegram для обсуждения всего: https://t.me/+KVMo9RLY9N5iMGFi

Репозиторий с материалами семинаров: https://github.com/ADKosm/lsml-2023-public

Наше облако: https://console.cloud.yandex.ru/cloud/b1gmbu8tiomda9eqotbr

Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github.

Самостоятельные задачи сдаются в Google forms. Для каждого задания своя отдельная ссылка на прием заданий:

Задание Ссылка для сдачи Ссылка на домашнее задание Дата выдачи Дедлайн
Мини домашнее задание 1. https://forms.gle/xGuyLeA6TcS9QHZ69 https://bit.ly/3XfKXDf 10 января 24 января 23:59
Мини домашнее задание 2. https://forms.gle/u8RrUhNuYrmoNZCz5 https://bit.ly/3iVDb3f 24 января 14 февраля 23:59
Мини домашнее задание 3. https://forms.gle/MWocwAMPbFVM181D7 https://bit.ly/3K7rRvT 14 февраля 4 марта 23:59
Мини домашнее задание 4. https://forms.gle/QQbw66q6oDfS6jJ18 https://bit.ly/3L2iiyG 7 марта 23 марта 23:59
Основное домашнее задание https://forms.gle/2LLAZcyh2wJenUKM9 https://bit.ly/3xjRTEH 14 февраля 23 марта 23:59

Семинары

Семинары проводятся по вторникам в 18:10 по МСК - https://us06web.zoom.us/j/86855537064

Консультации

Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.

При необходимости, можно писать на почту или в Telegram.

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Мини-домашние задания. Дедлайн на сдачу заданий - 2-3 недели (см таблицу).
  • Большое домашнее задание (будет выдано ориентировочно на 3 семинаре).
  • Дополнительно будет проведено мини-соревнование. За него можно заработать только дополнительные баллы (в основную формулу оценки они не входят).

Итоговая оценка вычисляется:

Oитоговая = 0.125*(OМДЗ1 + OМДЗ2 + OМДЗ3 + OМДЗ4) + 0.5*OДЗ [+ 0.1*OСоревнование]

Правила сдачи заданий

Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами.

Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

Полезные материалы

Книги

  1. Ron Bekkerman, Mikhail Bilenko, John Langford. Scaling up Machine Learning: Parallel and Distributed Approaches, Cambridge University Press, 2011.
  2. Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets, Cambridge University Press, 2014.
  3. Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series), The MIT Press, 2016.
  4. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. Advanced Analytics with Spark: Patterns for Learning from Data at Scale, O'Reilly Media, 2015.

Странички прошлых лет

http://wiki.cs.hse.ru/Машинное_обучение_на_больших_данных