Renju (проект)
Ментор | Симагин Денис |
Учебный семестр | Осень 2017 |
Учебный курс | 2-й курс |
Максимальное количество студентов, выбравших проект: 10 | |
Что это за проект?
Cочетание reinforcement learning и deep learning является "горячей" темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Данный проект заключается в изучении подходов, использующихся в AlphaGo, и их реализации при создание собственного алгоритма для игры в рендзю.
Молния: вышла новая статья статья.
Для того, чтобы попасть на проект, нужно пройти собеседование.
Чему вы научитесь?
- Чтение научных статей на английском.
- Погружение в машинное обучение.
- Сверточные нейронные сети
- Обучение с подкреплением
- Ревью кода.
Какие начальные требования?
- Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
- Знание Python 3, Git и работа с командной оболочкой.
- Базовые знания в машинном обучении
- Хорошая математическая подготовка
- Английский
Какие будут использоваться технологии?
- В качестве основного языка будет Python 3
- Для обучения сейчас принято использовать tensorflow, однако набирает популярность библиотека cntk (она шустрая).
- Так же вы можете проводить вычисления на ресурсах aws или воспользоваться google cloud.
Темы вводных занятий
- Кратко об обучении с учителем
- Линейные модели, градиентный спуск
- Введение в нейронные сети
- Сверточные сети
- Обучение с подкреплением
Направления развития
DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
Критерии оценки
- Необходимым, но не достаточным критерием получения "зачет" и выше является доклад на семинаре.
- Для оценки 7 и ниже необходимо в срок выполнять все задания.
- Дополнительные 3 балла распределяются на основании качества вашей модели по сравнению с коллегами.
Ориентировочное расписание занятий
Проект предполагает еженедельные встречи для проведения семинаров и отслеживания прогресса. Время будет обсуждаться отдельно с группой. Возможен вариант с утром (8-10) в стенах ШАДа или вечером (7-9) в ВШЭ.