Darin (deep and reinforced intelligence net) — различия между версиями
(Новая страница: «{{Карточка_командного_проекта |name=DaRiNa (Deep reinforced net) |company=Яндекс |mentor=Денис Симагин |mentor_login={{…») |
|||
Строка 1: | Строка 1: | ||
− | {{ | + | {{Карточка_проекта |
|name=DaRiNa (Deep reinforced net) | |name=DaRiNa (Deep reinforced net) | ||
− | |||
|mentor=Денис Симагин | |mentor=Денис Симагин | ||
|mentor_login={{URLENCODE:Simagin.denis|WIKI}} | |mentor_login={{URLENCODE:Simagin.denis|WIKI}} | ||
|semester=Осень 2018 | |semester=Осень 2018 | ||
|course=3-4 | |course=3-4 | ||
− | |number_of_students= | + | |number_of_students= до 10 |
|categorize=yes | |categorize=yes | ||
}} | }} | ||
− | |||
===Что это за проект?=== | ===Что это за проект?=== | ||
− | + | Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю. | |
− | + | Для участия в проекте нужно пройти собеседование. | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
===Чему студент научится?=== | ===Чему студент научится?=== | ||
− | + | Чтение научных статей на английском | |
− | + | Погружение в машинное обучение, сверточные нейронные сети | |
− | + | Обучение с подкреплением | |
+ | Плохие шутки | ||
===Какие начальные требования?=== | ===Какие начальные требования?=== | ||
− | + | Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) | |
− | + | Знание Python 3, Git и работа с командной оболочкой | |
− | + | Хорошая математическая подготовка | |
− | + | Английский | |
===Какие будут использоваться технологии?=== | ===Какие будут использоваться технологии?=== | ||
− | Python3, scipy stack, PyTorch | + | Python3, scipy stack, PyTorch |
AWS/Gсloud | AWS/Gсloud | ||
− | + | ===Темы вводных занятий?=== | |
+ | Обучении с учителем | ||
+ | Линейные модели, градиентный спуск | ||
+ | Введение в нейронные сети | ||
+ | Сверточные сети | ||
+ | Обучение с подкреплением | ||
===Направления развития?=== | ===Направления развития?=== | ||
− | + | DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично. | |
− | + | ||
− | + | ||
===Критерии оценки?=== | ===Критерии оценки?=== | ||
− | + | В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки. | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + |
Версия 14:18, 26 октября 2018
Ментор | Денис Симагин |
Учебный семестр | Осень 2018 |
Учебный курс | 3-4-й курс |
Максимальное количество студентов, выбравших проект: до 10 | |
Что это за проект?
Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.
Для участия в проекте нужно пройти собеседование.
Чему студент научится?
Чтение научных статей на английском Погружение в машинное обучение, сверточные нейронные сети Обучение с подкреплением Плохие шутки
Какие начальные требования?
Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) Знание Python 3, Git и работа с командной оболочкой Хорошая математическая подготовка Английский
Какие будут использоваться технологии?
Python3, scipy stack, PyTorch AWS/Gсloud
Темы вводных занятий?
Обучении с учителем Линейные модели, градиентный спуск Введение в нейронные сети Сверточные сети Обучение с подкреплением
Направления развития?
DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
Критерии оценки?
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.