LSML 2023/2024

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 4-го курса ПМИ ФКН ВШЭ в 3 модуле. Проводится с 2017 года.

Лектор: Космачев Алексей Дмитриевич

Семинаристы: Алекберов Артем Темурович, Анищенко Илья Игоревич

Ассистент -

Лекции проходят в онлайн-режиме.

Вычислительные мощности в облаке Yandex.Cloud для курса предоставила компания Яндекс.

Полезные ссылки

Слайды лекций:

Получение доступа к Облаку -

Таблица с оценками:

Плейлист с записями всех занятий - тык

Чат в telegram с объявлениями и топиками по курсу: https://t.me/+pGkk3SpUQ35mNDEy

Репозиторий с материалами семинаров:

Наше облако:

Ошибки в материалах лекций/семинаров/заданий лучше всего оформлять в виде issue на github.

Самостоятельные задачи сдаются в Google forms. Для каждого задания своя отдельная ссылка на прием заданий:

Задание Ссылка для сдачи Ссылка на домашнее задание Дата выдачи Дедлайн
Мини домашнее задание 1.
Мини домашнее задание 2.
Мини домашнее задание 3.
Мини домашнее задание 4.
Основное домашнее задание

Семинары

Семинары проводятся по _ в _ по МСК -

Консультации

Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.

При необходимости, можно писать на почту или в Telegram.

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Мини-домашние задания. Дедлайн на сдачу заданий - 2-3 недели (см таблицу).
  • Большое домашнее задание (будет выдано ориентировочно на 3 семинаре).
  • Дополнительно будет проведено мини-соревнование. За него можно заработать только дополнительные баллы (в основную формулу оценки они не входят).

Итоговая оценка вычисляется:

Oитоговая = 0.125*(OМДЗ1 + OМДЗ2 + OМДЗ3 + OМДЗ4) + 0.5*OДЗ [+ 0.1*OСоревнование]

Правила сдачи заданий

Важно останавливать\удалять ресурсы, создаваемые в облаке, так как в противном случае финансов может не хватить для выполнения всех заданий. Полезно при этом овладеть навыком сохранения промежуточных данных в облачном хранилище - это позволит максимально быстро выполнять задания с минимальными финансовыми затратами.

Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

Полезные материалы

Книги

  1. Ron Bekkerman, Mikhail Bilenko, John Langford. Scaling up Machine Learning: Parallel and Distributed Approaches, Cambridge University Press, 2011.
  2. Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets, Cambridge University Press, 2014.
  3. Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning (Adaptive Computation and Machine Learning series), The MIT Press, 2016.
  4. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills. Advanced Analytics with Spark: Patterns for Learning from Data at Scale, O'Reilly Media, 2015.

Странички прошлых лет

http://wiki.cs.hse.ru/Машинное_обучение_на_больших_данных