SQuAD (проект) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
(не показана одна промежуточная версия этого же участника) | |||
Строка 19: | Строка 19: | ||
# Погружение в машинное обучение. | # Погружение в машинное обучение. | ||
# Нейронные сети для работы с текстами. | # Нейронные сети для работы с текстами. | ||
− | |||
# Ревью кода. | # Ревью кода. | ||
Строка 35: | Строка 34: | ||
=== Темы вводных занятий === | === Темы вводных занятий === | ||
− | # Кратко | + | # Кратко об обучении с учителем. |
# Линейные модели, градиентный спуск. | # Линейные модели, градиентный спуск. | ||
# Введение в нейронные сети. | # Введение в нейронные сети. |
Текущая версия на 15:31, 4 октября 2017
Ментор | Симагин Денис |
Учебный семестр | Осень 2017 |
Учебный курс | 2-й курс |
Максимальное количество студентов, выбравших проект: 10 | |
Что это за проект?
Проект носит исследовательский характер. Существует интересный датасет известный, как Suicide SQuAD. Необходимо предложить алгоритм, который способен "прочитать" статью, а затем по вопросу сгенерировать ответ на нее. Уже существует "пачка" научных статей, посвященных этой задаче. Наша цель заключается в том, чтобы изучить существующие методы и попробовать обучить собственную модель.
Для того, чтобы попасть на проект, нужно пройти собеседование.
Чему вы научитесь?
- Чтение научных статей на английском.
- Погружение в машинное обучение.
- Нейронные сети для работы с текстами.
- Ревью кода.
Какие начальные требования?
- Машина с UNIX-подобной ОС и мощной видеокартой (возможно облачная)
- Знание Python 3, Git и работа с командной оболочкой.
- Базовые знания в машинном обучении
- Хорошая математическая подготовка
- Английский
Какие будут использоваться технологии?
- В качестве основного языка будет Python 3
- Для обучения сейчас принято использовать tensorflow, однако набирает популярность библиотека cntk (она шустрая).
- Так же вы можете проводить вычисления на ресурсах aws или воспользоваться google cloud.
Темы вводных занятий
- Кратко об обучении с учителем.
- Линейные модели, градиентный спуск.
- Введение в нейронные сети.
- Сверточные сети
- Рекуррентные сети
- Нейронные сети для работы с текстом.
Направления развития
- Это достаточно свежая тема для исследований. Изучать статьи и проводить эксперименты можно долго.
- Поиск по английской wikipedia на основе обученной модели.
Критерии оценки
- Необходимым, но не достаточным критерием получения "зачет" и выше является доклад на семинаре.
- Для оценки 7 и ниже необходимо в срок выполнять все задания.
- Дополнительные 3 балла распределяются на основании качества вашей модели по сравнению с коллегами.
Ориентировочное расписание занятий
Проект предполагает еженедельные встречи для проведения семинаров и отслеживания прогресса. Время будет обсуждаться отдельно с группой. Возможен вариант с утром (8-10) в стенах ШАДа или вечером (7-9) в ВШЭ.