Прикладные задачи анализа данных (майнор ИАД)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Курс читается для студентов 3-го курса майнора ИАД в 3-4 модулях.

Проводится с 2016 года.

Лекции проходят по четвергам в 10:30 (Покровский бульвар, 11).

Полезные ссылки

Карточка курса и программа

Репозиторий с материалами на GitHub

Репозиторий с материалами на GitHub 2020

Почта для сдачи домашних заданий (на самом деле задания сдаются в AnyTask, но если он не работает, то присылайте на почту): hse.minor.dm+<номер группы>@gmail.com (например, hse.minor.dm+3@gmail.com)

Канал в telegram для объявлений: https://telegram.me/hse_minor_intro_dm_2019

Чат в telegram (осторожно, риск флуда и отсутствия ответов на содержательные вопросы): https://t.me/joinchat/A5rlQBSn7ROATFOWGlzRwg

Ссылка на курс в Anytask: https://anytask.org/course/609

Таблица с оценками: https://docs.google.com/spreadsheets/d/1xKah6P9GMiXU2vxjDZKs8gIE0NiA5VXf8Y8F3543VQA/edit?usp=sharing

Семинары

Группа Преподаватель Учебный ассистент Материалы семинаров Чат
ИАД-1 Багиян Нерсес Головина Мария https://github.com/hse-ds/iad-applied-ds/tree/master/2020/seminars/ https://t.me/joinchat/Atx7LkjahH5xBDp6TDnAyQ
ИАД-2 Ковалёв Алексей Константинович Бурданова Софья Павловны https://github.com/alexeykkovalev/hse-minor
ИАД-3 Скрынник Алексей Александрович Балабан Ирина Алексеевна https://github.com/hse-ds/iad-applied-ds/tree/master/2020/seminars/ https://t.me/joinchat/A98O_Rb0zyaVIw0pJivlTw
ИАД-4 Валиуллин Адель Марсович Тарасевич Владислав Сергеевич https://github.com/hse-ds/iad-applied-ds/tree/master/2020
ИАД-5 Сафронов Василий Вячеславович Дешеулин Олег Андреевич https://github.com/hse-ds/iad-applied-ds/tree/master/2020 https://t.me/pzad_iad_2020

Правила выставления оценок

В курсе предусмотрено несколько форм контроля знания:

  • Самостоятельные работы на семинарах, проверяющие знание основных фактов с лекций и семинаров
  • Практические домашние работы на Python
  • Контрольная где-то в середине курса
  • Письменный экзамен

Итоговая оценка вычисляется на основе оценки за работу в семестре и оценки за экзамен:

Oитоговая = Округление(0.4 * ДЗ + 0.1 * ПР + 0.2 * КР + 0.3 * Э)

ДЗ — средняя оценка за практические домашние задания

ПР — средняя оценка за проверочные работы на семинарах

КР — оценка за контрольную работу

Э — оценка за экзамен

Округление арифметическое.

Правила сдачи заданий

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются. Даже при опоздании на одну секунду. Сдавайте заранее.

При обнаружении плагиата оценки за домашнее задание обнуляются всем задействованным в списывании студентам, а также подаётся докладная записка в деканат. Следует помнить, что при повторном списывании деканат имеет право отчислить студента.

При наличии уважительной причины пропущенную проверочную можно написать позднее, а дедлайн по домашнему заданию может быть перенесён. Дедлайн по домашнему заданию переносится на количество дней, равное продолжительности уважительной причины. Решение о том, является ли причина уважительной, принимает исключительно учебный офис.

Лекции

Лекция 1 (23.01.2020). Рекомендательные системы. Матричные разложения. Обучение разложений: SGD, ALS, HALS. [Конспект]

Лекция 2 (30.01.2020). Неявный фидбек и iALS. Factorization machines. Метрики качества в рекомендательных системах. [Конспект]

Семинары

Практические задания

За каждый день просрочки после мягкого дедлайна снимается 1 балл. После жёсткого дедлайна работы не принимаются, но есть исключение. В течение семестра каждый студент может не более 2 раз сдать задание после жёсткого дедлайна — в этом случае за каждый день просрочки продолжает вычитаться по одному баллу (если не оговорено иное).

Задание 1. Контест на рекомендации

Вам предстоит поработать с логами рекомендательной системы, где для пользователей даны их сессии — документы, которые им были показаны, и реакция на них (клик или его отсутствие). Также для каждого документа известны его заголовок, содержание и уже подготовленный эмбеддинг для картинки из него. Для каждого пользователя дан тестовый набор документов — нужно для каждого из них предсказать, будет ли сделан клик или нет.

Соревнование google collab-only. Оцениваются только решения, полученные как результат работы ноутбука в коллабе, который загружен в anytask.

Дедлайн: 29 февраля 2020 года 03:00

Ссылка с инвайтом: https://www.kaggle.com/t/e37901b9cb7c45d89e884bdcc9795b0e

Контрольная работа

Экзамен

Страницы прошлых лет

2018/19 учебный год

2017/18 учебный год

2016/17 учебный год