Ask me (проект)
Ментор | Симагин Денис |
Учебный семестр | Осень 2016 |
Учебный курс | 2-й курс |
Проект можно развивать на летней практике | |
Максимальное количество студентов, выбравших проект: 4-5 | |
Внимание! Данный проект находится в архиве и реализован не будет. |
Семинар проекта можно найти здесь.
Что это за проект?
Существует интересная статья, описывающая модель, которая на вход принимает:
- Некоторый контекст, а именно несколько предложений.
- Простой и короткий вопрос.
А на выходе выдает некоторый осмысленный ответ в виде текста. Примечательно то, что в самой системе используется только обученные нейронные сети. В частности, помощью LSTM-сети модель запоминает контекст, оценивает вопрос и выдает ответ.
Проект заключает в:
- Воспроизведении результата статьи, на сколько это позволят нам наши вычислительные мощности.
- Изучении схожих статей.
- Проведении экспериментов.
Проект будет устроен следующим образом:
- Будут еженедельные семинары, на которых мы разберем всю необходимую теорию.
- На одном из семинаров вы проведете разбор статьи, которую изучили самостоятельно.
- Будет набор небольших упражнений для закрепления материала.
- Ревью кода ваших коллег по проекту.
- Мы будем постепенно двигаться к конечной цели - обучить собственную модель.
Важно. Проект требует много времени. Подразумевается большое количество вычислений и самостоятельные исследования.
Чему вы научитесь?
- Чтение самых свежих английских статей.
- Машинное обучение.
- Нейронные сети, рекуррентные нейронные сети и LSTM сети.
- Почувствуете себя исследователем.
Какие начальные требования?
- Наличие машины с UNIX-подобной ОС, владение командной оболочкой
- Вы должны писать на Python 3
- Необходимы знания Git, однако я всегда помогу в сложной ситуации
- Желательны базовые знания о машинном обучении
Какие будут использоваться технологии?
- В качестве основного языка будет Python 3.
- Нейронные сети мы будем обучать скорее всего с помощью Theano.
- Так же вы можете проводить вычисления на ресурсах aws или воспользоваться google cloud.
Темы вводных занятий
Будем планомерно погружаться в тему, весь 2 и 3 модули. Также каждый участник проекта сделает доклад статьи на схожую тему.
Направления развития
- Это абсолютно свежая тема для исследований. Изучать статьи и проводить свои эксперименты можно просто до бесконечности.
- Для демонстрации своих достижений вы можете сделать какой-нибудь телеграм-бот.
Критерии оценки
- Необходимым, но не достаточным критерием получения "зачет" и выше является доклад на семинаре.
- Также формальным критерием кураторов является наличие запускаемого программного обеспечения, которое демонстрирует ваши достижения. К примеру, скрипты, воспроизводящие результаты экспериментов.
- В рамках проектах вы будете выполнять небольшие обучающие задания и проводить эксперименты. Их выполнение в срок и будет оцениваться. А дальше мы просто проагрегируем ваши результаты.
- Для получения оценки от 8 и выше необходимо воспроизвести результат авторов статьи хотя бы в урезанном виде.
Ориентировочное расписание занятий
Семинары будут проходить в стенах Яндекса каждую неделю в фиксированный день (вторник, среда или четверг). Если будет желание, то можно несколько раз в выходные провести своеобразные хакатоны: собираемся вместе на целый день, работаем, общаемся и трескаем пиццу.