Darin (deep and reinforced intelligence net) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Fix course)
Строка 4: Строка 4:
 
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
 
|mentor_login={{URLENCODE:Simagin.denis|WIKI}}
 
|semester=Осень 2018
 
|semester=Осень 2018
|course=3-4
+
|course=2-3
 
|number_of_students= до 10
 
|number_of_students= до 10
 
|categorize=yes
 
|categorize=yes

Версия 15:26, 4 ноября 2018

Ментор Денис Симагин
Учебный семестр Осень 2018
Учебный курс 2-3-й курс
Максимальное количество студентов, выбравших проект: до 10



Что это за проект?

Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.

Для участия в проекте нужно пройти собеседование.

Чему студент научится?

Чтение научных статей на английском Погружение в машинное обучение, сверточные нейронные сети Обучение с подкреплением Плохие шутки

Какие начальные требования?

Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) Знание Python 3, Git и работа с командной оболочкой Хорошая математическая подготовка Английский

Какие будут использоваться технологии?

Python3, scipy stack, PyTorch AWS/Gсloud

Темы вводных занятий?

Обучении с учителем Линейные модели, градиентный спуск Введение в нейронные сети Сверточные сети Обучение с подкреплением

Направления развития?

DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.

Критерии оценки?

В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.