Ask me (семинар) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показана одна промежуточная версия 7 участников)
Строка 1: Строка 1:
--[[Участник:Simagin.denis|Simagin.Denis]] ([[Обсуждение участника:Simagin.denis|обсуждение]]) 20:53, 14 ноября 2016 (MSK)Описание [[Ask_me_(проект)|проекта]], последнее [[Ask_me_(семинар)#.D0.A1.D0.B5.D0.BC.D0.B8.D0.BD.D0.B0.D1.80.D1.8B|занятие]].
+
Описание [[Ask_me_(проект)|проекта]], последнее [[Ask_me_(семинар)#.D0.A1.D0.B5.D0.BC.D0.B8.D0.BD.D0.B0.D1.80.D1.8B|занятие]].
  
 
==Правила игры ==
 
==Правила игры ==
Строка 19: Строка 19:
  
 
===Репозитории===
 
===Репозитории===
 +
Студенты хранят свой код в следующих репозиториях
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
 
|Ментор  || https://github.com/dasimagin/askme
 
|Ментор  || https://github.com/dasimagin/askme
 
|-
 
|-
| Красавчик || ...
+
| Когтенков || https://github.com/aakogtenkov/Ask-me-if-you-can
 
|-
 
|-
| Умник || ...
+
|Остяков || https://github.com/PavelOstyakov/askme
 +
|-
 +
|Попов || https://github.com/Akiiino/Ask-Me-Anything
 +
|-
 +
|Ширин || https://github.com/shirinnikita/ask_me
 
|}
 
|}
  
 +
===Разбор статьи===
 +
В рамках проекта студент должен разобрать интересную для него статью и доложить ее на общем семинаре.
 +
 +
{| class="wikitable"
 +
|-
 +
! Студент !! Статья !! Дата
 +
|-
 +
|Когтенков || [https://papers.nips.cc/paper/5654-deep-knowledge-tracing.pdf Deep Knowledge Tracing] || 9 апреля
 +
|-
 +
|Остяков || [https://arxiv.org/pdf/1612.07411v1.pdf A Context-aware Attention Network for Interactive Question Answering] || 19 марта
 +
|-
 +
|Попов || [https://arxiv.org/pdf/1701.04189.pdf Deep Memory Networks for Attitude Identification] || 26 марта
 +
|-
 +
|Ширин || [https://arxiv.org/abs/1506.06714 Context-Sensitive Generation of Conversational Responses] || 16 апреля
 +
|}
 +
 +
===Лабораторные===
 +
Лабораторные проводятся для практического закрепления материала. Их выполнение учитывается в итоговой оценке.
 +
 +
# Результатом работы является jupyter notebook, где сохранен вывод вашего кода, графики и т.п. А так же его импорт в формат .py. Для автоматизации процесса можно настроить jupyter.
 +
# Когда сроки выполнения лабораторной завершены, вы выкладываете ее на ревью, создавая соответствующее задание и запрос на объединение ветки с мастером (не забудьте добавить проверяющего).
 +
# Ваш коллега проводит ревью кода и может оставлять замечания, как в виде комментариев к заданию, так и в файле .py. Оно предполагает проверку стиля и правильность кода, а также конструктивные замечания по производительности. Однако не стремитесь сразу оптимизировать код. Добейтесь лучше того, чтобы все работало правильно.
 +
# Когда ревью завершено, влейтесь в мастер и закройте задание.
 +
 +
===Результаты===
 +
Текущие результаты можно найти  [https://docs.google.com/spreadsheets/d/1gO6nHbLqMeLRXAa5Mubpfoc_-gk9DWCJ4mmnV_xaeig/edit?usp=sharing здесь]. Оценка складывается из нескольких частей:
 +
# Работа на семинаре
 +
# Доклад статьи
 +
# Итоговый результат
  
 
==Семинары==
 
==Семинары==
 +
 +
===H19.03===
 +
# Паша разобрал статью схожую с нашей. Авторы пытаются научить сеть задавать уточняющие вопросы, если это необходимо.
 +
# Анонсирован семинар на тему генерации датасета, а так же разбор DMN+.
 +
 +
'''Задание'''
 +
Воспроизвести DMN (можно в упрощенной версии) на данных bAbI. '''Дедлайн:''' 9 апреля.
 +
 +
===S02.03===
 +
Разбирали результаты L4, начали говорить на тему проекта.
 +
 +
===L5===
 +
Конкур можно найти [https://inclass.kaggle.com/c/en-phonetics здесь].
 +
 +
===S19.02===
 +
# Доразбирали вычисление градиента для рекуррентных сетей.
 +
# Еще раз поговорили о затухании и взрыве градиента.
 +
 +
'''Литература для чтения:'''
 +
* Прекрасный блог, где можно прочитать про рекуррентные сети, вот [http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/ первая статья], в начале есть ссылки на продолжение.
 +
* Про [http://colah.github.io/posts/2015-08-Understanding-LSTMs/ LSTM] с картинками.
 +
* Tensorflow и [https://www.tensorflow.org/tutorials/recurrent рекурретные] сети.
 +
* Как работать с последовательностями, [https://www.tensorflow.org/tutorials/seq2seq пример] tensorflow.
 +
 +
===S02.02===
 +
Начали говорить о рекуррентных сетях, я обещал подробнее описать математику обучения.
 +
# Поговорили о [https://en.wikipedia.org/wiki/Recurrent_neural_network рекурретных сетях] в общем
 +
# Архитектура [https://en.wikipedia.org/wiki/Long_short-term_memory LSTM] сети
 +
# Архитектура [https://arxiv.org/pdf/1412.3555v1.pdf GRU] сети
 +
 +
===S29.01===
 +
Еще раз вернулись к теме word embedding в контексте нейросетей, список затронутых статей:
 +
# [http://www.jmlr.org/papers/volume3/bengio03a/bengio03a.pdf Первая сеть], предсказывающая следующее слово.
 +
# [https://ronan.collobert.com/pub/matos/2008_nlp_icml.pdff Статья], где заменяется softmax
 +
# [https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf Статья] Миколова про word2vec.
 +
 +
===L4===
 +
Лабораторную работу можно найти [https://github.com/dasimagin/askme/blob/master/labs/L4%20-%20Word%20embedding.ipynb здесь].
 +
 +
'''Срок сдачи:'''
 +
* Начало ревью: 24 февраля 23:59
 +
* Окончание ревью: 8 марта 23:59
 +
 +
{| class="wikitable"
 +
|-
 +
! Ревьюер !! Разработчик !! Оценка
 +
|-
 +
| Остяков || Попов || -
 +
|-
 +
| Когтенков || Остяков || -
 +
|-
 +
| Ширин  || Когтенков || -
 +
|}
 +
 +
===H11.01===
 +
Произвели разбор L3. Описание модели победителя можно найти, а baseline доступен [https://github.com/dasimagin/askme/blob/master/labs/L3%20-%20Baseline.ipynb здесь].
 +
 +
Доклады мне не очень понравились. Постараюсь написать общие замечания.
 +
# Прежде всего у докладчика должна быть хорошая речь.
 +
# Нужно выделить то, что действительно важно и интересно для слушателя.
 +
# Делать на доске четкие и простые рисунки и записи, убедиться, что аудитория тебя понимает.
 +
# Не прыгать с темы на тему, а идти в соответсвии с логическим планом.
 +
 +
===S15.12===
 +
Поговорили про векторное представление слов, word2vec и другие сверточные сети для работы с естественными языками.
 +
 +
===H11.12===
 +
Занятие было посвящено выполнению второй лабораторной. Интересный ноутбук скоро появится [здесь].
 +
 +
===S08.12===
 +
'''1. Известные архитектуры сверточных сетей'''
 +
* [https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf Alexnet]
 +
* [https://arxiv.org/pdf/1409.1556.pdf VGG net]
 +
* [https://arxiv.org/pdf/1409.4842v1.pdf GoogLeNet]
 +
* [https://arxiv.org/pdf/1512.03385.pdf ResNet]
 +
'''2. Поговорили:'''
 +
* На что активируются нейроны в зависимости от слоя
 +
* Генерация 'похожих картинок'
 +
* Послойное обучение сети
 +
* Переобучение или дообучение уже готовой сети
 +
'''3. Изучили примеры для библиотеки Keras'''
 +
*  [https://github.com/fchollet/keras/blob/master/examples/mnist_mlp.py Полносвязанная сеть]
 +
* [https://github.com/fchollet/keras/blob/master/examples/mnist_cnn.py Сверточная сеть ]
 +
* [https://github.com/fchollet/keras/blob/master/examples/mnist_transfer_cnn.py Переобучение] сверточной сети
 +
 +
===L3===
 +
{| class="wikitable"
 +
|-
 +
! Студент !! CPU !! RAM !! GPU
 +
|-
 +
| Пример || 6 core, 3,5 GHz || 64GB || NVIDIA TITAN X
 +
|-
 +
| Попов || 4 core, 3.2 GHz || 8 GB || GeForce GTX 750 Ti
 +
|-
 +
| Остяков || 8 core, 2,6 GHz || 50 GB || -
 +
|-
 +
| Когтенков || 2 core, 1.4 GHz || 4 GB || -
 +
|-
 +
| Ширин || 2 core, 1.9 GHz || 8 GB || -
 +
|}
 +
 +
Победить в [https://inclass.kaggle.com/c/ch-ch конкурсе] классификации,  срок 3 января, 23:59.
 +
 +
Для этого вам понадобится
 +
* Установить [https://www.tensorflow.org Tensorflow]
 +
* Установить [https://keras.io Keras]
 +
* Запастись терпением
 +
 +
===S01.12===
 +
'''1. Полносвязанные сети:'''
 +
* Подсчитаны производные для [https://en.wikipedia.org/wiki/Backpropagation Backpropagation], обсуждены тонкости реализации.
 +
* Различные виды нелинейности: [https://en.wikipedia.org/wiki/Rectifier_(neural_networks) ReLu], [https://arxiv.org/pdf/1502.01852v1.pdf PReLu], [https://en.wikipedia.org/wiki/Sigmoid_function Sigmoid].
 +
* Обучение сетей при помощи [https://en.wikipedia.org/wiki/Autoencoder Autoencoder].
 +
 +
'''2. Сверточные сети:'''
 +
* Cтруктура [https://en.wikipedia.org/wiki/Convolutional_neural_network CNN].
 +
* Затронуты: [https://en.wikipedia.org/wiki/Convolution Convolution], [https://en.wikipedia.org/wiki/Convolutional_neural_network#Pooling_layer Pooling].
 +
* Влияние различных ядер свертки на структуру сети.
 +
* [https://en.wikipedia.org/wiki/Convolutional_neural_network#Choosing_hyperparameters Feature maps].
 +
* Разобрана архитектура [https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf Alexnet].
 +
* Сочетание из Convolutional и Dense слоев.
 +
 +
===S24.11===
 +
'''1. Регуляризация:'''
 +
* Разобрали L1 и L2 регуляризаторы, можно найти [https://en.wikipedia.org/wiki/Regularization_(mathematics) здесь].
 +
* Используйте простые классификаторы
 +
* Раняя остановка (смотрим качество на отложенном множестве)
 +
* Добавление шума
 +
* Комбинирование классификаторов
 +
 +
'''2. Полносвязанные сети:'''
 +
* Множественная классификация и [https://en.wikipedia.org/wiki/Softmax_function softmax].
 +
* Метод [http://www.machinelearning.ru/wiki/images/0/0f/karpinskaya-2010.pdf обратного распространения ошибки], проблема при обучении.
 +
* Инициализация весов:  и [http://jmlr.org/proceedings/papers/v9/glorot10a/glorot10a.pdf xavier] и другие [https://arxiv.org/pdf/1502.01852v1.pdf вариации].
 +
* Кратко о [https://en.wikipedia.org/wiki/Convolutional_neural_network#Dropout dropout].
 +
 +
===L2===
 +
 +
Задание можно найти [https://github.com/dasimagin/askme/blob/master/labs/L2%20-%20Nets.ipynb здесь],  срок 23:59 11 декабря.
 +
 
===S03.11===
 
===S03.11===
 
# [https://en.wikipedia.org/wiki/Feature_(machine_learning) Признаки] и какие они бывают. Об отборе признаков, кратко [https://habrahabr.ru/post/264915/ тут]. Может помочь на конкурсе.
 
# [https://en.wikipedia.org/wiki/Feature_(machine_learning) Признаки] и какие они бывают. Об отборе признаков, кратко [https://habrahabr.ru/post/264915/ тут]. Может помочь на конкурсе.
Строка 43: Строка 217:
  
 
===L1===
 
===L1===
 
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
! Ревьюер !! Разработчик
+
! Ревьюер !! Разработчик !! Оценка
 
|-
 
|-
|Рябинин || Попов
+
| Попов || Остяков || 10
 
|-
 
|-
| Попов || Остяков
+
| Остяков || Когтенков || 10
 
|-
 
|-
| Остяков || Когтенков
+
| Когтенков || Ширин || 9.7
 
|-
 
|-
| Когтенков || Ширин
 
|-
 
| Ширин || Рябинин
 
 
|}
 
|}
  
Для первой лабораторной работы вам потребуется:
+
Для [https://github.com/dasimagin/askme/blob/master/labs/L1%20-%20Gradient%20descent%20and%20linear%20models.ipynb первой] лабораторной работы вам потребуется:
 
# Настроить себе [https://pip.pypa.io/en/stable/ pip] для Python3
 
# Настроить себе [https://pip.pypa.io/en/stable/ pip] для Python3
 
# Освоить [http://jupyter.org Jupyter notebook]
 
# Освоить [http://jupyter.org Jupyter notebook]
 
# Установить пакеты [http://www.scipy.org scipy]: numpy, scipy, matplotlib
 
# Установить пакеты [http://www.scipy.org scipy]: numpy, scipy, matplotlib
 
Лабораторная будет состоять из нескольких частей:
 
# Изучение градиентного спуска на примере линейного классификатора + несколько теоретических задачек [coming soon...].
 
# Небольшой контест для того, чтобы почувствовать, что такое "много данных" [coming soon...] .
 

Текущая версия на 21:59, 13 декабря 2018

Описание проекта, последнее занятие.

Правила игры

Общение с ментором вне занятий приветствуется. Можно задавать вопросы, в том числе философские. Но перед тем, как написать, попробуйте спросить это у Яндекса. Также не обижайтесь, если в ответ вам пришла ссылка на документацию или какую-то статью.

Ключевые точки

Сверху нам спущены ключевые точки выполнения проекта. Для нас они скорее явлются формальными, тем не менее мы должны их соблюдать.

  1. 12-17 декабря - все включились в работу
  2. 20-25 марта - реализован объем работ, необходимый для зачета
  3. 30 мая - 3 июня - окончание проектной работы, вы готовы, как пионеры.
  4. начало июня - конкурс проектов.

Правило 2Х

У вас есть право на одну ошибку. Следующая - я отказываюсь с вами работать.

Репозитории

Студенты хранят свой код в следующих репозиториях

Ментор https://github.com/dasimagin/askme
Когтенков https://github.com/aakogtenkov/Ask-me-if-you-can
Остяков https://github.com/PavelOstyakov/askme
Попов https://github.com/Akiiino/Ask-Me-Anything
Ширин https://github.com/shirinnikita/ask_me

Разбор статьи

В рамках проекта студент должен разобрать интересную для него статью и доложить ее на общем семинаре.

Студент Статья Дата
Когтенков Deep Knowledge Tracing 9 апреля
Остяков A Context-aware Attention Network for Interactive Question Answering 19 марта
Попов Deep Memory Networks for Attitude Identification 26 марта
Ширин Context-Sensitive Generation of Conversational Responses 16 апреля

Лабораторные

Лабораторные проводятся для практического закрепления материала. Их выполнение учитывается в итоговой оценке.

  1. Результатом работы является jupyter notebook, где сохранен вывод вашего кода, графики и т.п. А так же его импорт в формат .py. Для автоматизации процесса можно настроить jupyter.
  2. Когда сроки выполнения лабораторной завершены, вы выкладываете ее на ревью, создавая соответствующее задание и запрос на объединение ветки с мастером (не забудьте добавить проверяющего).
  3. Ваш коллега проводит ревью кода и может оставлять замечания, как в виде комментариев к заданию, так и в файле .py. Оно предполагает проверку стиля и правильность кода, а также конструктивные замечания по производительности. Однако не стремитесь сразу оптимизировать код. Добейтесь лучше того, чтобы все работало правильно.
  4. Когда ревью завершено, влейтесь в мастер и закройте задание.

Результаты

Текущие результаты можно найти здесь. Оценка складывается из нескольких частей:

  1. Работа на семинаре
  2. Доклад статьи
  3. Итоговый результат

Семинары

H19.03

  1. Паша разобрал статью схожую с нашей. Авторы пытаются научить сеть задавать уточняющие вопросы, если это необходимо.
  2. Анонсирован семинар на тему генерации датасета, а так же разбор DMN+.

Задание Воспроизвести DMN (можно в упрощенной версии) на данных bAbI. Дедлайн: 9 апреля.

S02.03

Разбирали результаты L4, начали говорить на тему проекта.

L5

Конкур можно найти здесь.

S19.02

  1. Доразбирали вычисление градиента для рекуррентных сетей.
  2. Еще раз поговорили о затухании и взрыве градиента.

Литература для чтения:

  • Прекрасный блог, где можно прочитать про рекуррентные сети, вот первая статья, в начале есть ссылки на продолжение.
  • Про LSTM с картинками.
  • Tensorflow и рекурретные сети.
  • Как работать с последовательностями, пример tensorflow.

S02.02

Начали говорить о рекуррентных сетях, я обещал подробнее описать математику обучения.

  1. Поговорили о рекурретных сетях в общем
  2. Архитектура LSTM сети
  3. Архитектура GRU сети

S29.01

Еще раз вернулись к теме word embedding в контексте нейросетей, список затронутых статей:

  1. Первая сеть, предсказывающая следующее слово.
  2. Статья, где заменяется softmax
  3. Статья Миколова про word2vec.

L4

Лабораторную работу можно найти здесь.

Срок сдачи:

  • Начало ревью: 24 февраля 23:59
  • Окончание ревью: 8 марта 23:59
Ревьюер Разработчик Оценка
Остяков Попов -
Когтенков Остяков -
Ширин Когтенков -

H11.01

Произвели разбор L3. Описание модели победителя можно найти, а baseline доступен здесь.

Доклады мне не очень понравились. Постараюсь написать общие замечания.

  1. Прежде всего у докладчика должна быть хорошая речь.
  2. Нужно выделить то, что действительно важно и интересно для слушателя.
  3. Делать на доске четкие и простые рисунки и записи, убедиться, что аудитория тебя понимает.
  4. Не прыгать с темы на тему, а идти в соответсвии с логическим планом.

S15.12

Поговорили про векторное представление слов, word2vec и другие сверточные сети для работы с естественными языками.

H11.12

Занятие было посвящено выполнению второй лабораторной. Интересный ноутбук скоро появится [здесь].

S08.12

1. Известные архитектуры сверточных сетей

2. Поговорили:

  • На что активируются нейроны в зависимости от слоя
  • Генерация 'похожих картинок'
  • Послойное обучение сети
  • Переобучение или дообучение уже готовой сети

3. Изучили примеры для библиотеки Keras

L3

Студент CPU RAM GPU
Пример 6 core, 3,5 GHz 64GB NVIDIA TITAN X
Попов 4 core, 3.2 GHz 8 GB GeForce GTX 750 Ti
Остяков 8 core, 2,6 GHz 50 GB -
Когтенков 2 core, 1.4 GHz 4 GB -
Ширин 2 core, 1.9 GHz 8 GB -

Победить в конкурсе классификации, срок 3 января, 23:59.

Для этого вам понадобится

  • Установить Tensorflow
  • Установить Keras
  • Запастись терпением

S01.12

1. Полносвязанные сети:

  • Подсчитаны производные для Backpropagation, обсуждены тонкости реализации.
  • Различные виды нелинейности: ReLu, PReLu, Sigmoid.
  • Обучение сетей при помощи Autoencoder.

2. Сверточные сети:

  • Cтруктура CNN.
  • Затронуты: Convolution, Pooling.
  • Влияние различных ядер свертки на структуру сети.
  • Feature maps.
  • Разобрана архитектура Alexnet.
  • Сочетание из Convolutional и Dense слоев.

S24.11

1. Регуляризация:

  • Разобрали L1 и L2 регуляризаторы, можно найти здесь.
  • Используйте простые классификаторы
  • Раняя остановка (смотрим качество на отложенном множестве)
  • Добавление шума
  • Комбинирование классификаторов

2. Полносвязанные сети:

L2

Задание можно найти здесь, срок 23:59 11 декабря.

S03.11

  1. Признаки и какие они бывают. Об отборе признаков, кратко тут. Может помочь на конкурсе.
  2. Задача бинарной классификации.
  3. Градиентный спуск.
  4. Стохастический градиентный спуск. На английской вике больше интересной информации.

Для дополнительного чтения:

  1. Что полезно знать о машинном обучении.
  2. Английская вика про признаки
  3. Отбор признаков.
  4. Мощная теоретическая работа про стохастический градиентный спуск.

L1

Ревьюер Разработчик Оценка
Попов Остяков 10
Остяков Когтенков 10
Когтенков Ширин 9.7

Для первой лабораторной работы вам потребуется:

  1. Настроить себе pip для Python3
  2. Освоить Jupyter notebook
  3. Установить пакеты scipy: numpy, scipy, matplotlib