Майнор Интеллектуальный анализ данных/Прикладные задачи анализа данных

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Материалы курса "Прикладные задачи анализа данных"

Преподаватели: Д. И. Игнатов, Е. Л. Черняк

ВНИМАНИЕ! Просим группу ИАД-2 придти на занятия ИАД-1, КК 4427, группы ИАД-3 и ИАД-4 – на занятия ИАД-6, КК 4336, или ИАД-7, КК 4428.

Домашние задания можно выполнять индивидуально или в группах по два человека. Отчет по домашнему заданию отправляйте по адресу: iad.hse@yandex.ru , тему письма сформатируйте так: ИАД-X ДЗ-Y Name1 Name2, где X – номер группы, Y – номер домашнего задания, а Name1 Name2 - ваши фамилии (или Name1, если вы делаете домашнее задание самостоятельно) .

Дедлайны домашних заданий в списке ниже. Если вы сдаете домашнее задание после дедлайна, то оценка снижается на 10% за каждый день опоздания.

  • Дедлайн по 1 домашнему заданию: все группы -- до 23:59 9.02, кроме ИАД-2 -- до 23:59 16.02.
  • Дедлайн по 2 домашнему заданию: все группы -- до 23:59 25.02 (внимание, ДЗ обновлено!!!)
  • Дедлайн по 3 домашнему заданию: все группы -- до 23:59 9.03
  • Дедлайн по 4 домашнему заданию: все группы -- до 23:59 6.04
  • Дедлайн по 5 домашнему заданию: все группы -- до 23:59 16.04
  • Дедлайн по техническому заданию по проекту: все группы, кроме ИАД-6 -- до 23:59 13.04, ИАД-6 -- до 23:59 20.04
  • Дедлайн по отчету проекту: все группы -- до 23:59 14.06

Отчет по ДЗ состоит из трех частей: содержательный отчет, код и данные. Первые две части можно совместить в ipython notebook.

Оценки за домашние задания:

(NEW) Инструкции по выполнению проекта

Автоматы по курсу: средняя оценка за домашние задания >= 8, оценка за ТЗ = 1, оценка за отчет по проекту >= 8

Материалы занятий

19.01.2017

Лекция 1. Введение (upd: формула оценки)

26.01.2017

Лекция 2. Введение в АОТ. Морфология, методы выделения ключевых слов, синтаксис

Практическое занятие 1. Тетрадки и данные

Домашнее задание 1. Сравнение стилей

02.01.2017

Лекция 3 Векторная модель

| Лекция 4 Синтаксис

Практическое занятие 2. Туториалы и полезные ссылки

(обновление) Домашнее задание 2. Word2vec

9.02.2017

Лекция 5. Классификация в задачах АОТ

Задания из курса Лауры Каллмайер

Туториал по CRF Suite

16.02.2017

Данные для Домашнего задания З

Домашнее задание 3

Туториалы по keras

Deep Learning 4 NLP

Understanding CNN for NLP

Understanding LSTMs

Oxford DL for NLP

Stanford NLP with DL

Практическое занятие 3. Нейронные сети


02.03.2017

Лекция 6. Поиск частых множеств и ассоциативные правила (повторение с примерами прикладных задач)


16.03.2017

Лекция 7. Поиск частых последовательностей (Sequence mining)

(UPD) Домашнее задание 4

(UPD) Домашнее задание 5

23.03.2017

Лабораторная по деревьям решений

Лекция 8. Майнинг последовательностей для демографических данных

06.04.2017

Рамочная презентация: введение в рекомендательные системы

Case study 1. Подходы на основе сходства по пользователям и предметам рекомендации для коллаборативной фильтрации. Оценка качества на основе бимодального скользящего контроля.

Скрипт для работы в классе и первая часть домашнего задания

13.04.2017

Матричная факторизация в задаче коллаборативной фильтрации (SVD, NMF, BMF). Case-study 2.

Скрипт на Питоне для SVD и NMF.

20.04.2017

Гибридные рекомендательные системы на примере рекомендаций онлайн-радиостанций.

Case-study 3

Surprise test (пример работы с библиотекой рекомендательных систем в Python)

27.04.2017

Спектральная кластеризация для анализа Интернет-данных


11.05.2017

Лабораторная работа по SNA

Лекция про ссылочное ранжирование

Материал для самостоятельного чтения:

18.05.2017

18.05 лекция перенесена в ауд. 5307, Шаболовка 26


ВНИМАНИЕ! Занятия 18 мая ОТМЕНЯЮТСЯ!


25.05.2017

Методы кластеризации. DBScan и Mean-Shift (Denclue)

01.06.2017

Распознавание изображений