Разработка сервиса классификации и извлечения информации из документов — различия между версиями
(→Организация работы (Как студенты будут работать в команде?)) |
|||
Строка 27: | Строка 27: | ||
Детали и подробности организации на вводных занятиях | Детали и подробности организации на вводных занятиях | ||
− | === | + | === Компоненты (Из каких частей состоит проект?) === |
− | + | ||
+ | 1. Знакомство с существующими наработками | ||
+ | 2. Формирование бизнес-требований, обсуждение и дизайн прототипа продукта (MVP, MLP) | ||
+ | 3. Планирование и проведение спринтов по разработке прототипа продукта | ||
+ | 5. Проведение демонстраций | ||
+ | 6. Документирование и закрытие проекта | ||
=== Какие будут использоваться технологии? === | === Какие будут использоваться технологии? === |
Версия 14:57, 18 сентября 2017
Компания | OpenTRM (Open Trade and Risk Management) |
Учебный семестр | Осень 2017 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 3-5 | |
Содержание
|
Что это за проект?
В рамках данного проекта студентам предлагается участвовать в разработке прототипа продукта/сервиса который осуществляет анализ сканов документов произвольного формата (PDF файлы) для распределения их по заданным классам и извлечения из них необходимой информации. Несмотря на наличие подобных продуктов на рынке, большинство существующих продуктов ориентированы на использование заранее определенных шаблонов на извлечение информации (например, шаблон налоговой декларации или счета-фактуры). Разрабатываемый продукт применяет модели построенные на алгоритмах машинного обучения, которые ориентируются на формирование обучающей выборки на основе прошлой истории классификации документов и извлечения информации вручную. Это позволяет настроить прототип на корректную работу с инструментами автоматически в процессе обучения и без дополнительной настройки шаблонов документов.
Чему научатся студенты? Что самое интересное в проекте?
-Формулировать постановку задачи -Проводить разработку в изменяющихся условиях и требованиях -Участвовать в проекте по разработке прототипа продукта и выводе продукта на рынок (в команде, не индивидуально!) -Применять алгоритмы машинного обучения для статистической обработки финансовой информации -Применять современные техники обработки текстовой информации и извлечения информации (IE - Infromation Extraction)
Организация работы (Как студенты будут работать в команде?)
Организация разработки и взаимодействие на проекте будет построено по Scrum:
- Все студенты участники Scrum команды - Product Owner от OpenTRM - Scrum Master от OpenTRM
Детали и подробности организации на вводных занятиях
Компоненты (Из каких частей состоит проект?)
1. Знакомство с существующими наработками 2. Формирование бизнес-требований, обсуждение и дизайн прототипа продукта (MVP, MLP) 3. Планирование и проведение спринтов по разработке прототипа продукта 5. Проведение демонстраций 6. Документирование и закрытие проекта
Какие будут использоваться технологии?
test
Какие начальные требования?
test
Темы вводных занятий
test
Критерии оценки
test
Похожие проекты
test
Контактная информация
test