Майнор Интеллектуальный анализ данных/Прикладные задачи анализа данных — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(15.06.2017)
 
(не показано 8 промежуточных версии 3 участников)
Строка 3: Строка 3:
 
Преподаватели: Д. И. Игнатов, Е. Л. Черняк
 
Преподаватели: Д. И. Игнатов, Е. Л. Черняк
  
<big>'''ВНИМАНИЕ!  Просим группу ИАД-2 придти на занятия ИАД-1, КК 4427, группы ИАД-3 и ИАД-4 – на занятия  ИАД-6, КК 4336, или ИАД-7, КК 4428.'''
+
<big>'''ВНИМАНИЕ!   
 +
 
 +
15.06 лекция не состоится!
 +
 
 +
В группах ИАД 2, 3, 4 15.06 консультация с 13-30 до 15-00'''
 
</big>  
 
</big>  
  
Строка 34: Строка 38:
 
* [https://docs.google.com/spreadsheets/d/1j0IYcG6-mbpBsDaRehaLgGXzLxzdJkqZlB9fjgTy2qE/edit?usp=sharing оценки за ТЗ]
 
* [https://docs.google.com/spreadsheets/d/1j0IYcG6-mbpBsDaRehaLgGXzLxzdJkqZlB9fjgTy2qE/edit?usp=sharing оценки за ТЗ]
  
[https://www.dropbox.com/s/lfu8mrsnr6hcuoq/IndGroupTask.pdf?dl=0 (NEW) Инструкции по выполнению проекта]
+
[https://www.dropbox.com/s/a42xl06dctn3h17/Eng-IndGroupTask_KCh.pdf?dl=0(NEW) Инструкции по выполнению проекта]
  
 
Автоматы по курсу: средняя оценка за домашние задания >= 8, оценка за ТЗ = 1, оценка за отчет по проекту >= 8
 
Автоматы по курсу: средняя оценка за домашние задания >= 8, оценка за ТЗ = 1, оценка за отчет по проекту >= 8
 +
 +
[https://docs.google.com/spreadsheets/d/1MH4h7iksglbgBxI6UYhb7BcftFlCw7yiyVMsSxBx5h8/edit?usp=sharing Итоговые оценки]
  
 
== Материалы занятий ==
 
== Материалы занятий ==
Строка 73: Строка 79:
 
[https://www.dropbox.com/s/otnidq7fvly8hwp/hw3_data.zip?dl=0 Данные для Домашнего задания З]
 
[https://www.dropbox.com/s/otnidq7fvly8hwp/hw3_data.zip?dl=0 Данные для Домашнего задания З]
  
[https://www.dropbox.com/s/ypmfmeyurjwflpg/hw3.pdf?dl=0?dl=0 Домашнее задание 3]
+
[https://www.dropbox.com/s/clgiw5kcvgz652q/hw3.pdf?dl=0 Домашнее задание 3]
  
 
[https://github.com/fchollet/keras-resources Туториалы по keras]
 
[https://github.com/fchollet/keras-resources Туториалы по keras]
Строка 165: Строка 171:
  
 
[https://yadi.sk/i/PSgr-h2Z3JipaD Распознавание изображений]
 
[https://yadi.sk/i/PSgr-h2Z3JipaD Распознавание изображений]
 +
 +
 +
 +
=== 15.06.2017 ===
 +
 +
15.06 лекция не состоится!
 +
 +
В группах ИАД 2, 3, 4 15.06 консультация с 13-30 до 15-00
 +
 +
 +
=== 22.06.2017 ===
 +
 +
Итоговый экзамен в виде защиты проектов и собеседования по курсу.
 +
 +
Адрес: ауд. 3316 Шаболовка ул., д. 26
 +
 +
Команда защищает свой проект перед преподавателем курса предпочтительно со своим ноутбуком.

Текущая версия на 01:22, 22 июня 2017

Материалы курса "Прикладные задачи анализа данных"

Преподаватели: Д. И. Игнатов, Е. Л. Черняк

ВНИМАНИЕ!

15.06 лекция не состоится!

В группах ИАД 2, 3, 4 15.06 консультация с 13-30 до 15-00

Домашние задания можно выполнять индивидуально или в группах по два человека. Отчет по домашнему заданию отправляйте по адресу: iad.hse@yandex.ru , тему письма сформатируйте так: ИАД-X ДЗ-Y Name1 Name2, где X – номер группы, Y – номер домашнего задания, а Name1 Name2 - ваши фамилии (или Name1, если вы делаете домашнее задание самостоятельно) .

Дедлайны домашних заданий в списке ниже. Если вы сдаете домашнее задание после дедлайна, то оценка снижается на 10% за каждый день опоздания.

  • Дедлайн по 1 домашнему заданию: все группы -- до 23:59 9.02, кроме ИАД-2 -- до 23:59 16.02.
  • Дедлайн по 2 домашнему заданию: все группы -- до 23:59 25.02 (внимание, ДЗ обновлено!!!)
  • Дедлайн по 3 домашнему заданию: все группы -- до 23:59 9.03
  • Дедлайн по 4 домашнему заданию: все группы -- до 23:59 6.04
  • Дедлайн по 5 домашнему заданию: все группы -- до 23:59 16.04
  • Дедлайн по техническому заданию по проекту: все группы, кроме ИАД-6 -- до 23:59 13.04, ИАД-6 -- до 23:59 20.04
  • Дедлайн по отчету проекту: все группы -- до 23:59 14.06

Отчет по ДЗ состоит из трех частей: содержательный отчет, код и данные. Первые две части можно совместить в ipython notebook.

Оценки за домашние задания:

Инструкции по выполнению проекта

Автоматы по курсу: средняя оценка за домашние задания >= 8, оценка за ТЗ = 1, оценка за отчет по проекту >= 8

Итоговые оценки

Материалы занятий

19.01.2017

Лекция 1. Введение (upd: формула оценки)

26.01.2017

Лекция 2. Введение в АОТ. Морфология, методы выделения ключевых слов, синтаксис

Практическое занятие 1. Тетрадки и данные

Домашнее задание 1. Сравнение стилей

02.01.2017

Лекция 3 Векторная модель

| Лекция 4 Синтаксис

Практическое занятие 2. Туториалы и полезные ссылки

(обновление) Домашнее задание 2. Word2vec

9.02.2017

Лекция 5. Классификация в задачах АОТ

Задания из курса Лауры Каллмайер

Туториал по CRF Suite

16.02.2017

Данные для Домашнего задания З

Домашнее задание 3

Туториалы по keras

Deep Learning 4 NLP

Understanding CNN for NLP

Understanding LSTMs

Oxford DL for NLP

Stanford NLP with DL

Практическое занятие 3. Нейронные сети


02.03.2017

Лекция 6. Поиск частых множеств и ассоциативные правила (повторение с примерами прикладных задач)


16.03.2017

Лекция 7. Поиск частых последовательностей (Sequence mining)

(UPD) Домашнее задание 4

(UPD) Домашнее задание 5

23.03.2017

Лабораторная по деревьям решений

Лекция 8. Майнинг последовательностей для демографических данных

06.04.2017

Рамочная презентация: введение в рекомендательные системы

Case study 1. Подходы на основе сходства по пользователям и предметам рекомендации для коллаборативной фильтрации. Оценка качества на основе бимодального скользящего контроля.

Скрипт для работы в классе и первая часть домашнего задания

13.04.2017

Матричная факторизация в задаче коллаборативной фильтрации (SVD, NMF, BMF). Case-study 2.

Скрипт на Питоне для SVD и NMF.

20.04.2017

Гибридные рекомендательные системы на примере рекомендаций онлайн-радиостанций.

Case-study 3

Surprise test (пример работы с библиотекой рекомендательных систем в Python)

27.04.2017

Спектральная кластеризация для анализа Интернет-данных


11.05.2017

Лабораторная работа по SNA

Лекция про ссылочное ранжирование

Материал для самостоятельного чтения:

18.05.2017

18.05 лекция перенесена в ауд. 5307, Шаболовка 26


ВНИМАНИЕ! Занятия 18 мая ОТМЕНЯЮТСЯ!


25.05.2017

Методы кластеризации. DBScan и Mean-Shift (Denclue)

01.06.2017

Распознавание изображений


15.06.2017

15.06 лекция не состоится!

В группах ИАД 2, 3, 4 15.06 консультация с 13-30 до 15-00


22.06.2017

Итоговый экзамен в виде защиты проектов и собеседования по курсу.

Адрес: ауд. 3316 Шаболовка ул., д. 26

Команда защищает свой проект перед преподавателем курса предпочтительно со своим ноутбуком.