Darin (deep and reinforced intelligence net) — различия между версиями
Строка 10: | Строка 10: | ||
===Что это за проект?=== | ===Что это за проект?=== | ||
− | Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю. | + | Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Конечная цель перенести идеи статью [https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zero] на игру [https://en.wikipedia.org/wiki/Renju рендзю]. |
Для участия в проекте нужно пройти собеседование. | Для участия в проекте нужно пройти собеседование. | ||
Строка 34: | Строка 34: | ||
Обучение с подкреплением | Обучение с подкреплением | ||
===Направления развития?=== | ===Направления развития?=== | ||
− | DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично. | + | DeepMind и Blizzard сделали [https://deepmind.com/blog/deepmind-and-blizzard-open-starcraft-ii-ai-research-environment/ песочницу] для StarCraft II, поле для исследований просто безгранично. |
===Критерии оценки?=== | ===Критерии оценки?=== | ||
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки. | В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки. |
Версия 14:23, 26 октября 2018
Ментор | Денис Симагин |
Учебный семестр | Осень 2018 |
Учебный курс | 3-4-й курс |
Максимальное количество студентов, выбравших проект: до 10 | |
Что это за проект?
Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.
Для участия в проекте нужно пройти собеседование.
Чему студент научится?
Чтение научных статей на английском Погружение в машинное обучение, сверточные нейронные сети Обучение с подкреплением Плохие шутки
Какие начальные требования?
Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) Знание Python 3, Git и работа с командной оболочкой Хорошая математическая подготовка Английский
Какие будут использоваться технологии?
Python3, scipy stack, PyTorch AWS/Gсloud
Темы вводных занятий?
Обучении с учителем Линейные модели, градиентный спуск Введение в нейронные сети Сверточные сети Обучение с подкреплением
Направления развития?
DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
Критерии оценки?
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.