Darin (deep and reinforced intelligence net) — различия между версиями
(Fix topics' list) |
(→Какие будут использоваться технологии?) |
||
Строка 25: | Строка 25: | ||
Английский | Английский | ||
===Какие будут использоваться технологии?=== | ===Какие будут использоваться технологии?=== | ||
− | Python3 | + | * Python3 |
− | AWS/ | + | * Scipy stack |
+ | * PyTorch (возможно, Tensorflow) | ||
+ | * AWS/GCloud | ||
+ | |||
===Темы вводных занятий?=== | ===Темы вводных занятий?=== | ||
* Обучении с учителем | * Обучении с учителем |
Версия 19:30, 4 ноября 2018
Ментор | Денис Симагин |
Учебный семестр | Осень 2018 |
Учебный курс | 2-3-й курс |
Максимальное количество студентов, выбравших проект: до 10 | |
Что это за проект?
Сочетание reinforcement learning и deep learning является горячей темой на сегодняшний день. К примеру, изучите статью Playing atari with deep reinforcement learning. Также вы, наверняка, слышали о AlpaGo, программе, которая впервые победила человека, профессионально играющего в Go. Подробнее об этом здесь. Конечная цель перенести идеи статью AlphaGo Zero на игру рендзю.
Для участия в проекте нужно пройти собеседование.
Чему студент научится?
Чтение научных статей на английском Погружение в машинное обучение, сверточные нейронные сети Обучение с подкреплением Плохие шутки
Какие начальные требования?
Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная) Знание Python 3, Git и работа с командной оболочкой Хорошая математическая подготовка Английский
Какие будут использоваться технологии?
- Python3
- Scipy stack
- PyTorch (возможно, Tensorflow)
- AWS/GCloud
Темы вводных занятий?
- Обучении с учителем
- Линейные модели, градиентный спуск
- Введение в нейронные сети
- Сверточные сети
- Обучение с подкреплением
- Разбор базовых статей
Направления развития?
DeepMind и Blizzard сделали песочницу для StarCraft II, поле для исследований просто безгранично.
Критерии оценки?
В конце проекта проводится турнир между алгоритмами, на основе которого и выставляются оценки.