Renju (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница, с помощью формы Новый_проект)
 
 
(не показаны 2 промежуточные версии этого же участника)
Строка 12: Строка 12:
 
=== Что это за проект? ===
 
=== Что это за проект? ===
 
Cочетание [https://en.wikipedia.org/wiki/Reinforcement_learning reinforcement learning] и [https://en.wikipedia.org/wiki/Deep_learning deep learning] является "горячей" темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о [https://en.wikipedia.org/wiki/AlphaGo AlpaGo], программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Данный проект заключается в изучении подходов, использующихся  в AlphaGo, и их реализации при создание собственного алгоритма для игры в [https://en.wikipedia.org/wiki/Renju рендзю].
 
Cочетание [https://en.wikipedia.org/wiki/Reinforcement_learning reinforcement learning] и [https://en.wikipedia.org/wiki/Deep_learning deep learning] является "горячей" темой на сегодняшний день. К примеру, изучите статью [http://arxiv.org/pdf/1312.5602v1.pdf Playing atari with deep reinforcement learning]. Также вы, наверняка, слышали о [https://en.wikipedia.org/wiki/AlphaGo AlpaGo], программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом [https://storage.googleapis.com/deepmind-media/alphago/AlphaGoNaturePaper.pdf здесь]. Данный проект заключается в изучении подходов, использующихся  в AlphaGo, и их реализации при создание собственного алгоритма для игры в [https://en.wikipedia.org/wiki/Renju рендзю].
 +
 +
'''Молния:''' вышла новая статья [https://www.nature.com/articles/nature24270.epdf?author_access_token=VJXbVjaSHxFoctQQ4p2k4tRgN0jAjWel9jnR3ZoTv0PVW4gB86EEpGqTRDtpIz-2rmo8-KG06gqVobU5NSCFeHILHcVFUeMsbvwS-lxjqQGg98faovwjxeTUgZAUMnRQ статья].
  
 
Для того, чтобы попасть на проект, нужно пройти собеседование.
 
Для того, чтобы попасть на проект, нужно пройти собеседование.

Текущая версия на 21:51, 19 октября 2017

Ментор Симагин Денис
Учебный семестр Осень 2017
Учебный курс 2-й курс
Максимальное количество студентов, выбравших проект: 10



Что это за проект?

Cочетание reinforcement learning и deep learning является "горячей" темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Данный проект заключается в изучении подходов, использующихся в AlphaGo, и их реализации при создание собственного алгоритма для игры в рендзю.

Молния: вышла новая статья статья.

Для того, чтобы попасть на проект, нужно пройти собеседование.

Чему вы научитесь?

  1. Чтение научных статей на английском.
  2. Погружение в машинное обучение.
  3. Сверточные нейронные сети
  4. Обучение с подкреплением
  5. Ревью кода.

Какие начальные требования?

  1. Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
  2. Знание Python 3, Git и работа с командной оболочкой.
  3. Базовые знания в машинном обучении
  4. Хорошая математическая подготовка
  5. Английский

Какие будут использоваться технологии?

  1. В качестве основного языка будет Python 3
  2. Для обучения сейчас принято использовать tensorflow, однако набирает популярность библиотека cntk (она шустрая).
  3. Так же вы можете проводить вычисления на ресурсах aws или воспользоваться google cloud.

Темы вводных занятий

  1. Кратко об обучении с учителем
  2. Линейные модели, градиентный спуск
  3. Введение в нейронные сети
  4. Сверточные сети
  5. Обучение с подкреплением

Направления развития

DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.

Критерии оценки

  1. Необходимым, но не достаточным критерием получения "зачет" и выше является доклад на семинаре.
  2. Для оценки 7 и ниже необходимо в срок выполнять все задания.
  3. Дополнительные 3 балла распределяются на основании качества вашей модели по сравнению с коллегами.

Ориентировочное расписание занятий

Проект предполагает еженедельные встречи для проведения семинаров и отслеживания прогресса. Время будет обсуждаться отдельно с группой. Возможен вариант с утром (8-10) в стенах ШАДа или вечером (7-9) в ВШЭ.