Darin (deep and reinforced intelligence net) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «{{Карточка_командного_проекта |name=DaRiNa (Deep reinforced net) |company=Яндекс |mentor=Денис Симагин |mentor_login={{…»)
 
Строка 1: Строка 1:
{{Карточка_командного_проекта
+
{{Карточка_проекта
 
|name=DaRiNa (Deep reinforced net)
 
|name=DaRiNa (Deep reinforced net)
|company=Яндекс
 
 
|mentor=Денис Симагин
 
|mentor=Денис Симагин
 
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
 
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
 
|semester=Осень 2018
 
|semester=Осень 2018
 
|course=3-4
 
|course=3-4
|number_of_students=3-4
+
|number_of_students= до 10
 
|categorize=yes
 
|categorize=yes
 
}}
 
}}
 
  
 
===Что это за проект?===
 
===Что это за проект?===
Это исследовательский проект. Существует датасет SQuAD 2.0. Проблема заключается в том, чтобы прочитать параграф текста, а затем по вопросу сгенерировать ответ. Уже существует пачка научных статей, посвященных этой задаче. Наша цель заключается в том, чтобы изучить существующие методы, попробовать обучить собственную модель и на основе ее построить фактологический поиск по статьям Википедии.
+
Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.
  
На первом этапе в качестве базового поиска можно использовать поисковую машину Яндекса. Однако один из студентов может взять на себя также и задачу базового поиска. В качестве демонстрации проделанной работы предлагаю сделать специальный навык для Алисы (это значит, что сервис должен отвечать онлайн), по сути поднять собственный сервис на одной из облачных платформ.
+
Для участия в проекте нужно пройти собеседование.
 
+
Команда Яндекса любезно согласилась нам предоставить разметку для реальных фактологических запросов к Алисе. А студенты, которые покажут лучшие результаты, смогут пройти летнюю стажировку и сделать вклад в Алису, внедрив своё решение.
+
 
+
Для того, чтобы попасть на проект, нужно пройти собеседование.
+
  
 
===Чему студент научится?===
 
===Чему студент научится?===
Работа в команде, проведение ревью, развертывание сервиса в облаке.
+
Чтение научных статей на английском
Современные модели работы с текстом, разработка на Python3.
+
Погружение в машинное обучение, сверточные нейронные сети
Плохим шуткам.
+
Обучение с подкреплением
 +
Плохие шутки
 
===Какие начальные требования?===
 
===Какие начальные требования?===
Наличие хорошей машины с GPU (или аренда в облаке).
+
Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
Навыки в обучении больших моделей.
+
Знание Python 3, Git и работа с командной оболочкой
Уверенное владение Python3.
+
Хорошая математическая подготовка
Умение читать научные статьи на английском.
+
Английский
 
===Какие будут использоваться технологии?===
 
===Какие будут использоваться технологии?===
Python3, scipy stack, PyTorch.
+
Python3, scipy stack, PyTorch
 
AWS/Gсloud
 
AWS/Gсloud
Возможно MongoDB для базового поиска.
+
===Темы вводных занятий?===
 +
Обучении с учителем
 +
Линейные модели, градиентный спуск
 +
Введение в нейронные сети
 +
Сверточные сети
 +
Обучение с подкреплением
 
===Направления развития?===
 
===Направления развития?===
Повышение качества модели.
+
DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
Расширение базы документов.
+
 
Ускорение работы.
+
 
===Критерии оценки?===
 
===Критерии оценки?===
Оценка команды будет зависеть от конечного качества модели, в качестве базы возьмем текущее качество фактологических ответов Алисы.
+
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.
 
+
Персональные оценки выставляются на основе личного вклада студента (может быть выше, чем оценка команда).
+
 
+
===Контакты===
+
[[Участник:Simagin.denis|Денис Симагин]]
+

Версия 14:18, 26 октября 2018

Ментор Денис Симагин
Учебный семестр Осень 2018
Учебный курс 3-4-й курс
Максимальное количество студентов, выбравших проект: до 10



Что это за проект?

Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.

Для участия в проекте нужно пройти собеседование.

Чему студент научится?

Чтение научных статей на английском Погружение в машинное обучение, сверточные нейронные сети Обучение с подкреплением Плохие шутки

Какие начальные требования?

Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) Знание Python 3, Git и работа с командной оболочкой Хорошая математическая подготовка Английский

Какие будут использоваться технологии?

Python3, scipy stack, PyTorch AWS/Gсloud

Темы вводных занятий?

Обучении с учителем Линейные модели, градиентный спуск Введение в нейронные сети Сверточные сети Обучение с подкреплением

Направления развития?

DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.

Критерии оценки?

В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.