LSML 2023/2024

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 4-го курса ПМИ ФКН ВШЭ в 3 модуле. Проводится с 2017 года.

Лектор: Космачев Алексей Дмитриевич

Семинаристы: Алекберов Артем Темурович, Анищенко Илья Игоревич

Ассистент -

Лекции проходят в онлайн-режиме.

Вычислительные мощности в облаке Yandex.Cloud для курса предоставила компания Яндекс.

Полезные ссылки

Слайды лекций: тык

Получение доступа к Облаку - https://forms.gle/Bo6wst4qfZ89TwPd7

Таблица с оценками: тык

Плейлист с записями всех занятий - тык

Чат в telegram с объявлениями и топиками по курсу: https://t.me/+pGkk3SpUQ35mNDEy

Репозиторий с материалами семинаров: тык

Наше облако: https://console.cloud.yandex.ru/cloud/b1gjgaju2nhl8bbacq3f

Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github.

Самостоятельные задачи сдаются в Google forms. Для каждого задания своя отдельная ссылка на прием заданий:

Задание Ссылка для сдачи Ссылка на домашнее задание Дата выдачи Дедлайн
Мини домашнее задание 1. https://forms.gle/caSVYF9ogmVsRwSn8 тык 11 февраля 18 февраля 23:59
Мини домашнее задание 2. https://forms.gle/EzXK6uAcarmuBfVm8 тык 21 февраля 3 марта 23:59
Мини домашнее задание 3. https://forms.gle/1rzQenpfnn3RDHZf9 тык 13 марта 24 марта 23:59
Основное домашнее задание https://forms.gle/4XKotxy4yBk7Dwx49 тык 4 марта 24 марта 23:59

Лекции и Семинары

Лекции проводит Космачев Алексей по СБ 11:10 - 12:30 по МСК - ссылка

Семинары проводят:

- Алекберов Артем по ЧТ в 11:10-12:30 по МСК - ссылка

- Анищенко Илья по СБ в 14:40-16:00 по МСК - ссылка

Консультации

Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.

При необходимости, можно писать на почту или в Telegram.

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Мини-домашние задания. Дедлайн на сдачу заданий - 2-3 недели (см таблицу).
  • Большое домашнее задание (будет выдано ориентировочно на 3 семинаре).
  • Дополнительно будет проведено мини-соревнование. За него можно заработать только дополнительные баллы (в основную формулу оценки они не входят).

Итоговая оценка вычисляется:

Oитоговая = 0.5*[(OМДЗ1 + OМДЗ2 + OМДЗ3 + OМДЗ4)/3] + 0.5*OДЗ

Правила сдачи заданий

Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами.

Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

Полезные материалы

Книги

  1. Ron Bekkerman, Mikhail Bilenko, John Langford. Scaling up Machine Learning: Parallel and Distributed Approaches, Cambridge University Press, 2011.
  2. Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets, Cambridge University Press, 2014.
  3. Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series), The MIT Press, 2016.
  4. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. Advanced Analytics with Spark: Patterns for Learning from Data at Scale, O'Reilly Media, 2015.

Странички прошлых лет

http://wiki.cs.hse.ru/Машинное_обучение_на_больших_данных