Машинное обучение на больших данных

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 3-го курса ПМИ ФКН ВШЭ в 4 модуле.

Проводится с 2017 года.

Лектор: Зимовнов Андрей Вадимович

Лекции проходят по понедельникам, 10:30 - 11:50, ауд. 402.

Вычислительные мощности в облаке Azure для курса предоставила компания Microsoft.

Полезные ссылки

Репозиторий с материалами на GitHub

Почта для сдачи домашних заданий: ?

Канал в telegram для объявлений: https://t.me/lsml17announces

Чат с преподавателями (не флудить): https://t.me/joinchat/AAAAAEJNxlU5Ci3KaRR2QQ

Таблица с оценками: ?

Оставить отзыв на курс: ?

Вопросы по курсу можно задавать на почту курса, а также в телеграм лектору (@ZEMUSHKA) или семинаристу. Вопросы по материалам лекций/семинаров и по заданиям лучше всего оформлять в виде issue на github.

Семинары

Группа Преподаватель Учебный ассистент Страница Расписание
145 (РС) Умнов Алексей Витальевич  ? Семинары группы 145  ?

Консультации

Консультации с преподавателями и учебными ассистентами (если иное не оговорено на странице семинаров конкретной группы) по курсу проводятся по предварительной договорённости ввиду невостребованности регулярных консультаций.

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Практические домашние работы на Python
  • Устный экзамен

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = 0.7 * Oнакопленная + 0.3 * Оэкз

Оценка за работу в семестре вычисляется по формуле

Oнакопленная = 0.3 * Oдз1 + 0.3 * Одз2 + 0.4 * Одз3

Необходимым условием для получения автомата является накопленная оценка, равная 8 или выше.

Правила сдачи заданий

На каждое задание каждому студенту отводится 2 недели беспрерывной работы ресурсов в облаке Azure.

Дедлайны по всем домашним заданиям являются жёсткими, то есть после срока работы не принимаются.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины дедлайн по домашнему заданию может быть перенесён (при этом получить дополнительные баллы за призовые места на конкурсе можно только при участии в общий срок). Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Лекция 1 (3 апреля). Онлайн-обучение и линейные модели [Слайды]

Лекция 2 (10 апреля). Введение в Apache Spark [Слайды]

Лекция 3 (17 апреля). Рекомендательные системы [Слайды]

Лекция 4 (24 апреля). Градиентный бустинг [Слайды]

Лекция 5 (15 мая). Введение в TensorFlow [Слайды]

Лекция 6 (22 мая). Сверточные сети [Слайды]

Практические задания

Задание 1. Рекомендательная система на Apache Spark

Дата выдачи: 17.04.2017 23:59MSK

Дедлайн: 10.05.2016 23:59MSK

Условие: https://docs.google.com/document/d/1LMs8QBpD60qLPvrxPcav5I3tb9PJZkx4t8JuFoH_YOA/edit?usp=sharing В условие будут добавляться комментарии, следите за обновлениями.

Задание 2 и 3. Сверточные сети в TensorFlow

Дата выдачи: 22.05.2017 23:59MSK

Дедлайн 2 задания: 01.06.2017 23:59MSK

Дедлайн 3 задания: 12.06.2017 23:59MSK

Условие: https://docs.google.com/document/d/1EN-0jAjC5ZAaE-7dR5oWDAOPZYh7lsBE0n_C3yP0q5U/edit?usp=sharing

Экзамен

Дата: ?

Место: ?

Вопросы к экзамену: ?

Время начала Группы
 ?  ?

Полезные материалы

Книги

?

Курсы по машинному обучению на больших данных

?