Darin (deep and reinforced intelligence net) — различия между версиями

Версия 14:23, 26 октября 2018


Ментор	Денис Симагин
Учебный семестр	Осень 2018
Учебный курс	3-4-й курс

Максимальное количество студентов, выбравших проект: до 10
Содержание 1 Что это за проект? 2 Чему студент научится? 3 Какие начальные требования? 4 Какие будут использоваться технологии? 5 Темы вводных занятий? 6 Направления развития? 7 Критерии оценки?

Что это за проект?

Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.

Для участия в проекте нужно пройти собеседование.

Чему студент научится?

Чтение научных статей на английском Погружение в машинное обучение, сверточные нейронные сети Обучение с подкреплением Плохие шутки

Какие начальные требования?

Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) Знание Python 3, Git и работа с командной оболочкой Хорошая математическая подготовка Английский

Какие будут использоваться технологии?

Python3, scipy stack, PyTorch AWS/Gсloud

Темы вводных занятий?

Обучении с учителем Линейные модели, градиентный спуск Введение в нейронные сети Сверточные сети Обучение с подкреплением

Направления развития?

DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.

Критерии оценки?

В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.

@@ Строка 10: / Строка 10: @@
 ===Что это за проект?===
-Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.
+Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Конечная цель перенести идеи статью [https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zero] на игру [https://en.wikipedia.org/wiki/Renju рендзю].
 Для участия в проекте нужно пройти собеседование.
@@ Строка 34: / Строка 34: @@
 Обучение с подкреплением
 ===Направления развития?===
-DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
+DeepMind и Blizzard сделали [https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/ песочницу] для StarCraft II, поле для исследований просто безгранично.
 ===Критерии оценки?===
 В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.

Darin (deep and reinforced intelligence net) — различия между версиями

Версия 14:23, 26 октября 2018

Содержание

Что это за проект?

Чему студент научится?

Какие начальные требования?

Какие будут использоваться технологии?

Темы вводных занятий?

Направления развития?

Критерии оценки?

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

Навигация

Инструменты