Renju (проект) — различия между версиями
(Новая страница, с помощью формы Новый_проект) |
|||
(не показаны 2 промежуточные версии этого же участника) | |||
Строка 12: | Строка 12: | ||
=== Что это за проект? === | === Что это за проект? === | ||
Cочетание [https://en.wikipedia.org/wiki/Reinforcement_learning reinforcement learning] и [https://en.wikipedia.org/wiki/Deep_learning deep learning] является "горячей" темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о [https://en.wikipedia.org/wiki/AlphaGo AlpaGo], программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Данный проект заключается в изучении подходов, использующихся в AlphaGo, и их реализации при создание собственного алгоритма для игры в [https://en.wikipedia.org/wiki/Renju рендзю]. | Cочетание [https://en.wikipedia.org/wiki/Reinforcement_learning reinforcement learning] и [https://en.wikipedia.org/wiki/Deep_learning deep learning] является "горячей" темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о [https://en.wikipedia.org/wiki/AlphaGo AlpaGo], программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Данный проект заключается в изучении подходов, использующихся в AlphaGo, и их реализации при создание собственного алгоритма для игры в [https://en.wikipedia.org/wiki/Renju рендзю]. | ||
+ | |||
+ | '''Молния:''' вышла новая статья [https://www.nature.com/articles/nature24270.epdf?author_access_token=VJXbVjaSHxFoctQQ4p2k4tRgN0jAjWel9jnR3ZoTv0PVW4gB86EEpGqTRDtpIz-2rmo8-KG06gqVobU5NSCFeHILHcVFUeMsbvwS-lxjqQGg98faovwjxeTUgZAUMnRQ статья]. | ||
Для того, чтобы попасть на проект, нужно пройти собеседование. | Для того, чтобы попасть на проект, нужно пройти собеседование. |
Текущая версия на 21:51, 19 октября 2017
Ментор | Симагин Денис |
Учебный семестр | Осень 2017 |
Учебный курс | 2-й курс |
Максимальное количество студентов, выбравших проект: 10 | |
Что это за проект?
Cочетание reinforcement learning и deep learning является "горячей" темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Данный проект заключается в изучении подходов, использующихся в AlphaGo, и их реализации при создание собственного алгоритма для игры в рендзю.
Молния: вышла новая статья статья.
Для того, чтобы попасть на проект, нужно пройти собеседование.
Чему вы научитесь?
- Чтение научных статей на английском.
- Погружение в машинное обучение.
- Сверточные нейронные сети
- Обучение с подкреплением
- Ревью кода.
Какие начальные требования?
- Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
- Знание Python 3, Git и работа с командной оболочкой.
- Базовые знания в машинном обучении
- Хорошая математическая подготовка
- Английский
Какие будут использоваться технологии?
- В качестве основного языка будет Python 3
- Для обучения сейчас принято использовать tensorflow, однако набирает популярность библиотека cntk (она шустрая).
- Так же вы можете проводить вычисления на ресурсах aws или воспользоваться google cloud.
Темы вводных занятий
- Кратко об обучении с учителем
- Линейные модели, градиентный спуск
- Введение в нейронные сети
- Сверточные сети
- Обучение с подкреплением
Направления развития
DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
Критерии оценки
- Необходимым, но не достаточным критерием получения "зачет" и выше является доклад на семинаре.
- Для оценки 7 и ниже необходимо в срок выполнять все задания.
- Дополнительные 3 балла распределяются на основании качества вашей модели по сравнению с коллегами.
Ориентировочное расписание занятий
Проект предполагает еженедельные встречи для проведения семинаров и отслеживания прогресса. Время будет обсуждаться отдельно с группой. Возможен вариант с утром (8-10) в стенах ШАДа или вечером (7-9) в ВШЭ.