Прикладные задачи анализа данных (майнор - весна 2019) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(RecSys: Неделя 8. 23.05.2019)
 
(не показано 13 промежуточных версии 4 участников)
Строка 41: Строка 41:
 
ДЗ 2. Обучение с подкреплением II: [https://github.com/grafft/hse-tasks/tree/master/minor-module4/hw2 алгоритм актор-критик], срок - 24.03.2019 23:59, вопросы задавать [https://t.me/sonyabur ассистенту].
 
ДЗ 2. Обучение с подкреплением II: [https://github.com/grafft/hse-tasks/tree/master/minor-module4/hw2 алгоритм актор-критик], срок - 24.03.2019 23:59, вопросы задавать [https://t.me/sonyabur ассистенту].
  
ДЗ 3. Анализ текстов I:
+
ДЗ 3. Анализ текстов: [https://yadi.sk/d/OUcDK6o3iUZGTw Текстовая классификация], срок - 10.06.2019 09:59, решения присылать на dz3.iad@yandex.ru
 
+
ДЗ 4. Анализ текстов II:
+
  
 
=== Система оценок ===
 
=== Система оценок ===
Строка 58: Строка 56:
  
 
[https://docs.google.com/spreadsheets/d/1gXsuQMNVuC2rsjoIg5sa_1g9uxtmS9DAg8inMHT_wYE/edit?usp=sharing Таблица с оценками]
 
[https://docs.google.com/spreadsheets/d/1gXsuQMNVuC2rsjoIg5sa_1g9uxtmS9DAg8inMHT_wYE/edit?usp=sharing Таблица с оценками]
 +
 +
=== Экзамен ===
 +
Экзамен пройдет 20 июня 2019 г. в ауд. 3231 с 10 часов. [https://yadi.sk/i/BahvFjhWiRv_Xw Вопросы к экзамену]
  
 
=== Программа ===
 
=== Программа ===
Строка 93: Строка 94:
 
'''Лекция''': Иерархическое обучение с подкреплением [https://yadi.sk/i/Qpv09MbQJdNTAQ (слайды)]
 
'''Лекция''': Иерархическое обучение с подкреплением [https://yadi.sk/i/Qpv09MbQJdNTAQ (слайды)]
  
'''Семинар''': [https://github.com/grafft/hse-tasks/blob/master/minor-module4/seminar5/sem5_options.ipynb HAM]
+
'''Семинар''': [https://github.com/grafft/hse-tasks/blob/master/minor-module4/seminar5/sem5_options.ipynb Options]
  
 
==== Неделя 7. 28.02.2019  ====  
 
==== Неделя 7. 28.02.2019  ====  
Строка 109: Строка 110:
 
==== Неделя 9. 14.03.2019  ====  
 
==== Неделя 9. 14.03.2019  ====  
  
'''Лекция''': Обучение и планирование [ссылка (слайды)]
+
'''Лекция''': Обучение и планирование [https://yadi.sk/i/_K-rive0oythxg (слайды)]
  
 
'''Семинар''': [https://github.com/grafft/hse-tasks/tree/master/minor-module4/seminar8 Dyna]
 
'''Семинар''': [https://github.com/grafft/hse-tasks/tree/master/minor-module4/seminar8 Dyna]
Строка 115: Строка 116:
 
==== Неделя 10. 21.03.2019  ====  
 
==== Неделя 10. 21.03.2019  ====  
  
'''Лекция''': Обучение в частично-наблюдаемой среде [ссылка (слайды)]
+
'''Лекция''': Обучение в частично-наблюдаемой среде [https://yadi.sk/i/v7pHOgTKt2oj_Q (слайды)]
 +
 
 +
'''Семинар''':
 +
 
 +
 
 +
==== NLP: Неделя 1. 04.04.2019  ====
 +
 
 +
'''Лекция''': NLP: введение, базовые элементы пайплайна [https://yadi.sk/i/i9Qh5YTWCjlj0A (слайды)]
 +
 
 +
'''Семинар''': [https://yadi.sk/d/bN-HPvFzPF9IIQ Sem_tokenize_morph]
 +
 
 +
==== NLP: Недели 2-3. 11.04.2019, 18.04.2019  ====
 +
 
 +
'''Лекции''': Векторные признаки в NLP: От мешка слов к языковым моделям [https://yadi.sk/i/G9Ni7Otf5D1_Hw (слайды)]
 +
 
 +
'''Семинары''': [https://yadi.sk/d/y4qxxPkUts7sbg Sem_emb_lm]
 +
 
 +
==== NLP: Неделя 4. 25.04.2019  ====
 +
 
 +
'''Лекция''': NER:Извлечение именованных сущностей [https://yadi.sk/i/9ZpzDL6bP69mUg (слайды)]
 +
 
 +
'''Семинар''': [https://yadi.sk/d/ZO5dTTfWzFitQg Sem_NER]
 +
 
 +
==== NLP: Неделя 5. 16.05.2019  ====
 +
 
 +
'''Лекция''': Текстовая классификация [https://yadi.sk/d/Y1rLhNRGFpq6WQ (слайды)]
 +
 
 +
'''Семинар''': [https://yadi.sk/d/D17JFFQLhRtNeg sem_classification]
 +
 
 +
==== NLP: Неделя 6. 23.05.2019  ====
 +
 
 +
'''Лекция''': Машинный перевод [https://yadi.sk/i/I6MJ8JGbYp825A (слайды)]
 +
 
 +
'''Семинар''': [https://yadi.sk/d/Ps0RxIFuLMFG5w Sem_MT]
 +
 
 +
 
 +
==== Data Mining: Неделя 7. 23.05.2019  ====
 +
 
 +
'''Лекция''':  1. Поиск частых множества и ассоциативных правил. Меры интересности: поддержка (support) и достовреность (confidence). Алгоритм Apriori. Примеры прикладных задач. [https://www.dropbox.com/s/nym660ufxw01imy/PatternMiningIntro_2019.pdf?dl=0 (слайды)]
 +
 
 +
'''Семинар''': [https://www.dropbox.com/s/t3vvcm0po9stswc/ARFIM.ipynb?dl=0 requires Orange 2.7] [https://www.dropbox.com/s/2pukzutj6fhn40t/market-basket.basket?dl=0 data] [https://www.dropbox.com/s/4ycaqn1ld4svndi/ARFIM.ows?dl=0 Orange 2.7 scheme] [https://www.dropbox.com/s/jg506wwnyeersoj/Exercises.pdf?dl=0 Exercises]
 +
 
 +
 
 +
==== RecSys: Неделя 8. 23.05.2019  ====
 +
 
 +
'''Лекция''': Типы рекомендательных систем (РС). Коллаборативная фильтрация. Подход на основе сходства по пользователям. Подход на основе сходства по объектам рекомендации. Меры сходства для РС. Методика тестирования рекомендательных систем.  [https://www.dropbox.com/s/a5xauz6i3zvh9nm/RecSys_course.pdf?dl=0 (слайды)]
 +
 
 +
'''Семинар''': [https://www.dropbox.com/s/le1a32x466r3fae/HW_assignment_1_modified_ENG.ipynb?dl=0 User-based and item-based notebook]
 +
 
 +
==== RecSys: Неделя 9. 23.05.2019  ====
 +
 
 +
'''Лекция''': Матричная факторизация для рекомендательных систем. SVD и его расширения (SVD++ и timeSVD). Случай неявного отлика (ALS подход). Неотрицательная матричная факторизация. Факторизационные машины и их связь с SVD. [https://www.dropbox.com/s/5fn5bsjgd3wwfcz/RecSys_MF_2019.pdf?dl=0 (слайды)]
  
'''Семинар''': [ссылка POMDP]
+
'''Семинар''': [https://www.dropbox.com/s/aij1ussi8p26on4/SVD%20%26%20NMF.ipynb?dl=0 SVD & NMF examples – notebook]
  
 
=== Рекомендуемые ресурсы и литература===
 
=== Рекомендуемые ресурсы и литература===

Текущая версия на 16:42, 14 июня 2019

О курсе

Читается для студентов 3 курса в 3-4 модулях.

Лекции проходят по четвергам, 10:30 – 11:50, ауд. 5306 (Шаболовка, 26).

Лекторы:

В 3 модуле: Александр Панов (обучение с подкреплением) - apanov[at]hse.ru

В 4 модуле: Дмитрий Игнатов (майнинг данных), Иван Смуров (автоматическая обработка текстов)

Канал для оповещений в Telegram

Оставить анонимный отзыв или предложение для курса.

Семинары

Семинары проходят по четвергам (Шаболовка, 26).

Группа Преподаватель Расписание Telegram
ИАД1 Александр Панов 09:00 – 10:20, ауд. 4336 Вопросы по семинарам и ДЗ
ИАД2 Алексей Скрынник 12:10 – 13:30, ауд. 3202 Чат группы
ИАД3 Наталия Козловская 09:00 – 10:20, ауд. 3316
ИАД4 Дмитрий Светличный 09:00 – 10:20, ауд. 4335
ИАД5 Дмитрий Светличный 12:10 – 13:30, ауд. 4335

Домашние задания

ДЗ 1. Обучение с подкреплением I: имитационное обучение, срок - 20.02.2019 23:59, вопросы задавать ассистенту.

ДЗ 2. Обучение с подкреплением II: алгоритм актор-критик, срок - 24.03.2019 23:59, вопросы задавать ассистенту.

ДЗ 3. Анализ текстов: Текстовая классификация, срок - 10.06.2019 09:59, решения присылать на dz3.iad@yandex.ru

Система оценок

Результирующая оценка рассчитывается по формуле:

Oитоговая = 0.6 * Oнакопл + 0.4 * Оэкз

Накопленная оценка рассчитывается по формуле:

Oнакопл = 0.6 * OДЗ (4 шт) + 0.2 * Oауд + 0.2 * Oколл

При накопленное оценке в 8, 9, 10 баллов такая же оценка за экзамен выставляется автоматом.

Таблица с оценками

Экзамен

Экзамен пройдет 20 июня 2019 г. в ауд. 3231 с 10 часов. Вопросы к экзамену

Программа

Неделя 1. 17.01.2019

Лекция: Введение в обучение с подкреплением. Основные понятия (слайды)

Семинар: MDP + CrossEntropy

Неделя 2. 24.01.2019

Лекция: Динамическое программирование (слайды)

Семинар: DP + ADP

Неделя 3. 31.01.2019

Лекция: Монте-Карло и временные различия (слайды)

Семинар: TD + Q-learning

Неделя 4. 07.02.2019

Занятия перенесены.

Неделя 5. 14.02.2019

Лекция: Аппроксимация функции полезности (слайды)

Семинар: DQN

Неделя 6. 21.02.2019

Лекция: Иерархическое обучение с подкреплением (слайды)

Семинар: Options

Неделя 7. 28.02.2019

Лекция: Градиент стратегии (слайды)

Семинар: Vanilla PG

Неделя 8. 07.03.2019

Лекция: Актор-критик (слайды)

Семинар: ActorCritic

Неделя 9. 14.03.2019

Лекция: Обучение и планирование (слайды)

Семинар: Dyna

Неделя 10. 21.03.2019

Лекция: Обучение в частично-наблюдаемой среде (слайды)

Семинар:


NLP: Неделя 1. 04.04.2019

Лекция: NLP: введение, базовые элементы пайплайна (слайды)

Семинар: Sem_tokenize_morph

NLP: Недели 2-3. 11.04.2019, 18.04.2019

Лекции: Векторные признаки в NLP: От мешка слов к языковым моделям (слайды)

Семинары: Sem_emb_lm

NLP: Неделя 4. 25.04.2019

Лекция: NER:Извлечение именованных сущностей (слайды)

Семинар: Sem_NER

NLP: Неделя 5. 16.05.2019

Лекция: Текстовая классификация (слайды)

Семинар: sem_classification

NLP: Неделя 6. 23.05.2019

Лекция: Машинный перевод (слайды)

Семинар: Sem_MT


Data Mining: Неделя 7. 23.05.2019

Лекция: 1. Поиск частых множества и ассоциативных правил. Меры интересности: поддержка (support) и достовреность (confidence). Алгоритм Apriori. Примеры прикладных задач. (слайды)

Семинар: requires Orange 2.7 data Orange 2.7 scheme Exercises


RecSys: Неделя 8. 23.05.2019

Лекция: Типы рекомендательных систем (РС). Коллаборативная фильтрация. Подход на основе сходства по пользователям. Подход на основе сходства по объектам рекомендации. Меры сходства для РС. Методика тестирования рекомендательных систем. (слайды)

Семинар: User-based and item-based notebook

RecSys: Неделя 9. 23.05.2019

Лекция: Матричная факторизация для рекомендательных систем. SVD и его расширения (SVD++ и timeSVD). Случай неявного отлика (ALS подход). Неотрицательная матричная факторизация. Факторизационные машины и их связь с SVD. (слайды)

Семинар: SVD & NMF examples – notebook

Рекомендуемые ресурсы и литература

Обучение с подкреплением: