Darin (deep and reinforced intelligence net) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Какие будут использоваться технологии?)
 
(не показаны 2 промежуточные версии этого же участника)
Строка 1: Строка 1:
 
{{Карточка_проекта
 
{{Карточка_проекта
|name=DaRiNa (Deep reinforced net)
+
|name=Darin (deep and reinforced intelligence net)
 
|mentor=Денис Симагин
 
|mentor=Денис Симагин
 
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
 
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
Строка 15: Строка 15:
  
 
===Чему студент научится?===
 
===Чему студент научится?===
Чтение научных статей на английском
+
* Чтение научных статей на английском
Погружение в машинное обучение, сверточные нейронные сети
+
* Работе с глубокими нейронными сетями
Обучение с подкреплением
+
* Обучение с подкреплением
Плохие шутки
+
* Плохие шутки
 +
 
 
===Какие начальные требования?===
 
===Какие начальные требования?===
Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
+
* Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
Знание Python 3, Git и работа с командной оболочкой
+
* Знание Python 3
Хорошая математическая подготовка
+
* Git и работа с командной оболочкой
Английский
+
* Английский
 +
 
 
===Какие будут использоваться технологии?===
 
===Какие будут использоваться технологии?===
 
* Python3
 
* Python3

Текущая версия на 19:36, 4 ноября 2018

Ментор Денис Симагин
Учебный семестр Осень 2018
Учебный курс 2-3-й курс
Максимальное количество студентов, выбравших проект: до 10



Что это за проект?

Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.

Для участия в проекте нужно пройти собеседование.

Чему студент научится?

  • Чтение научных статей на английском
  • Работе с глубокими нейронными сетями
  • Обучение с подкреплением
  • Плохие шутки

Какие начальные требования?

  • Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
  • Знание Python 3
  • Git и работа с командной оболочкой
  • Английский

Какие будут использоваться технологии?

  • Python3
  • Scipy stack
  • PyTorch (возможно, Tensorflow)
  • AWS/GCloud

Темы вводных занятий?

  • Обучении с учителем
  • Линейные модели, градиентный спуск
  • Введение в нейронные сети
  • Сверточные сети
  • Обучение с подкреплением
  • Разбор базовых статей

Направления развития?

DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.

Критерии оценки?

В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.