Ask me (проект)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Ментор Симагин Денис
Учебный семестр Осень 2016
Учебный курс 2-й курс
Проект можно развивать на летней практике
Максимальное количество студентов, выбравших проект: 4-5


Внимание! Данный проект находится в архиве и реализован не будет.

Семинар проекта можно найти здесь.

Что это за проект?

Существует интересная статья, описывающая модель, которая на вход принимает:

  1. Некоторый контекст, а именно несколько предложений.
  2. Простой и короткий вопрос.

А на выходе выдает некоторый осмысленный ответ в виде текста. Примечательно то, что в самой системе используется только обученные нейронные сети. В частности, помощью LSTM-сети модель запоминает контекст, оценивает вопрос и выдает ответ.

Проект заключает в:

  1. Воспроизведении результата статьи, на сколько это позволят нам наши вычислительные мощности.
  2. Изучении схожих статей.
  3. Проведении экспериментов.

Проект будет устроен следующим образом:

  1. Будут еженедельные семинары, на которых мы разберем всю необходимую теорию.
  2. На одном из семинаров вы проведете разбор статьи, которую изучили самостоятельно.
  3. Будет набор небольших упражнений для закрепления материала.
  4. Ревью кода ваших коллег по проекту.
  5. Мы будем постепенно двигаться к конечной цели - обучить собственную модель.

Важно. Проект требует много времени. Подразумевается большое количество вычислений и самостоятельные исследования.

Чему вы научитесь?

  1. Чтение самых свежих английских статей.
  2. Машинное обучение.
  3. Нейронные сети, рекуррентные нейронные сети и LSTM сети.
  4. Почувствуете себя исследователем.

Какие начальные требования?

  1. Наличие машины с UNIX-подобной ОС, владение командной оболочкой
  2. Вы должны писать на Python 3
  3. Необходимы знания Git, однако я всегда помогу в сложной ситуации
  4. Желательны базовые знания о машинном обучении

Какие будут использоваться технологии?

  1. В качестве основного языка будет Python 3.
  2. Нейронные сети мы будем обучать скорее всего с помощью Theano.
  3. Так же вы можете проводить вычисления на ресурсах aws или воспользоваться google cloud.

Темы вводных занятий

Будем планомерно погружаться в тему, весь 2 и 3 модули. Также каждый участник проекта сделает доклад статьи на схожую тему.

Направления развития

  1. Это абсолютно свежая тема для исследований. Изучать статьи и проводить свои эксперименты можно просто до бесконечности.
  2. Для демонстрации своих достижений вы можете сделать какой-нибудь телеграм-бот.

Критерии оценки

  1. Необходимым, но не достаточным критерием получения "зачет" и выше является доклад на семинаре.
  2. Также формальным критерием кураторов является наличие запускаемого программного обеспечения, которое демонстрирует ваши достижения. К примеру, скрипты, воспроизводящие результаты экспериментов.
  3. В рамках проектах вы будете выполнять небольшие обучающие задания и проводить эксперименты. Их выполнение в срок и будет оцениваться. А дальше мы просто проагрегируем ваши результаты.
  4. Для получения оценки от 8 и выше необходимо воспроизвести результат авторов статьи хотя бы в урезанном виде.

Ориентировочное расписание занятий

Семинары будут проходить в стенах Яндекса каждую неделю в фиксированный день (вторник, среда или четверг). Если будет желание, то можно несколько раз в выходные провести своеобразные хакатоны: собираемся вместе на целый день, работаем, общаемся и трескаем пиццу.