Учимся играть в нарды (проект) — различия между версиями

Версия 14:22, 24 ноября 2015


Ментор	Алексей Гусаков
Учебный семестр	Весна 2016
Учебный курс	1-й курс
Проект можно развивать на летней практике
Максимальное количество студентов, выбравших проект: 10
Содержание 1 Что это за проект? 2 Чему вы научитесь? 3 Какие начальные требования? 4 Какие будут использоваться технологии? 5 Темы вводных занятий 6 Направления развития 7 Критерии оценки 8 Ориентировочное расписание занятий

Что это за проект?

Проект заключается в том, чтобы научить компьютер играть в нарды. Делать мы это будем с помощью машинного обучения, причём все знания, которые алгоритм имеет о мире ограничиваются тем, какие ходы возможны из конкретной позиции и тем, какой же получился результат в конце (победа или поражение). Оказывается, что за несколько тысяч игр компьютер учится неплохо играть, а при более тщательном подходе обыгрывает человека.

Чему вы научитесь?

Основы машинного обучения, методы линейной регрессии, понятие о нейросетях, temporal-difference learning.

Какие начальные требования?

Интерес к машинному обучению, желание экспериментировать и упорно работать. Будет прикольно, но не просто.

Какие будут использоваться технологии?

c++, gtest, scikit-learn

Темы вводных занятий

Для начала немного поиграем в нарды.

Потом обсудим интерфейсы, тесты, базовые решения, time-difference learning.

Направления развития

Можно совершенствовать алгоритм машинного обучения, находя/генерируя автоматически факторы. Ещё одним развитием проекта является хорошая визуализация игры.

Критерии оценки

4 балла: Написан класс, описывающий позицию, реализованы правила, по которым делаются ходы.

+ балл (итого 5): Класс хорошо покрыт тестами.

+ балл (итого 6): Реализован механизм сравнения разных алгоритмов, есть несколько базовых реализаций алгоритма.

+ балл (итого 7): Реализован алгоритм, основанный на линейной модели, который побеждает все базовые подходы.

+ 2 балла (итого 9): То же самое, но на основе более глубокой нейоронной сети.

+ балл (итого 10): Как-то реализована визуализация, в результате чего можно и человеку сразиться с программой.

Также между алгоритмами будет проведён турнир на спецприз от ментора :)

Ориентировочное расписание занятий

В идеале - вечер пятницы или утро субботы.

@@ Строка 16: / Строка 16: @@
 === Чему вы научитесь? ===
-Основы машинного обучения, методы линейной регрессии, понятие о нейросетях, temporal-difference learning.
+* Основы машинного обучения, методы линейной регрессии, понятие о нейросетях, temporal-difference learning.
 === Какие начальные требования? ===

Учимся играть в нарды (проект) — различия между версиями

Версия 14:22, 24 ноября 2015

Содержание

Что это за проект?

Чему вы научитесь?

Какие начальные требования?

Какие будут использоваться технологии?

Темы вводных занятий

Направления развития

Критерии оценки

Ориентировочное расписание занятий

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Действия

Поиск

Навигация

Инструменты