Ann (answering neural net) — различия между версиями

Текущая версия на 01:31, 5 ноября 2018


Компания	Яндекс
Учебный семестр	Осень 2018
Учебный курс	3-4-й курс
Максимальное количество студентов, выбравших проект: 3-4
Содержание 1 Что это за проект? 2 Чему студент научится? 3 Какие начальные требования? 4 Какие будут использоваться технологии? 5 Направления развития? 6 Критерии оценки? 7 Контакты

Что это за проект?

Это исследовательский проект. Существует датасет SQuAD 2.0. Проблема заключается в том, чтобы прочитать параграф текста, а затем по вопросу сгенерировать ответ. Уже существует пачка научных статей, посвященных этой задаче. Наша цель заключается в том, чтобы изучить существующие методы, попробовать обучить собственную модель и на основе ее построить фактологический поиск по статьям Википедии.

На первом этапе в качестве базового поиска можно использовать поисковую машину Яндекса. Однако один из студентов может взять на себя также и задачу базового поиска. В качестве демонстрации проделанной работы предлагаю сделать специальный навык для Алисы (это значит, что сервис должен отвечать онлайн), по сути поднять собственный сервис на одной из облачных платформ.

Команда Яндекса любезно согласилась нам предоставить разметку для реальных фактологических запросов к Алисе. А студенты, которые покажут лучшие результаты, смогут пройти летнюю стажировку и сделать вклад в Алису, внедрив своё решение.

Для того, чтобы попасть на проект, нужно пройти собеседование.

Чему студент научится?

Работа в команде, проведение ревью, развертывание сервиса в облаке.
Современные модели работы с текстом, разработка на Python3.
Плохим шуткам.

Какие начальные требования?

Наличие хорошей машины с GPU (или аренда в облаке).
Навыки в обучении больших моделей.
Уверенное владение Python3.
Умение читать научные статьи на английском.

Какие будут использоваться технологии?

Python3
Scipy stack
PyTorch.
AWS/Gсloud
Возможно, MongoDB для базового поиска.

Направления развития?

Повышение качества модели.
Расширение базы документов.
Ускорение работы.

Критерии оценки?

Оценка команды будет зависеть от конечного качества модели, в качестве базы возьмем текущее качество фактологических ответов Алисы. Персональные оценки выставляются на основе личного вклада студента (может быть выше, чем оценка команда).

Контакты

Денис Симагин

@@ Строка 12: / Строка 12: @@
 ===Что это за проект?===
-Это исследовательский проект. Существует датасет [SQuAD 2.0](https://rajpurkar.github.io/SQuAD-explorer/). Проблема заключается в том, чтобы прочитать параграф текста, а затем по вопросу сгенерировать ответ. Уже существует пачка научных статей, посвященных этой задаче. Наша цель заключается в том, чтобы изучить существующие методы, попробовать обучить собственную модель и на основе ее построить фактологический поиск по статьям Википедии.
+Это исследовательский проект. Существует датасет [https://rajpurkar.github.io/SQuAD-explorer/ SQuAD 2.0]. Проблема заключается в том, чтобы прочитать параграф текста, а затем по вопросу сгенерировать ответ. Уже существует пачка научных статей, посвященных этой задаче. Наша цель заключается в том, чтобы изучить существующие методы, попробовать обучить собственную модель и на основе ее построить фактологический поиск по статьям Википедии.
 На первом этапе в качестве базового поиска можно использовать поисковую машину Яндекса. Однако один из студентов может взять на себя также и задачу базового поиска. В качестве демонстрации проделанной работы предлагаю сделать специальный навык для Алисы (это значит, что сервис должен отвечать онлайн), по сути поднять собственный сервис на одной из облачных платформ.

Ann (answering neural net) — различия между версиями

Текущая версия на 01:31, 5 ноября 2018

Содержание

Что это за проект?

Чему студент научится?

Какие начальные требования?

Какие будут использоваться технологии?

Направления развития?

Критерии оценки?

Контакты

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

Навигация

Инструменты