Разработка сервиса классификации и извлечения информации из документов
Компания | OpenTRM (Open Trade and Risk Management) |
Учебный семестр | Осень 2017 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 3-5 | |
Содержание
|
Что это за проект?
В рамках данного проекта студентам предлагается участвовать в разработке прототипа продукта/сервиса который осуществляет анализ сканов документов произвольного формата (PDF файлы) для распределения их по заданным классам и извлечения из них необходимой информации. Несмотря на наличие подобных продуктов на рынке, большинство существующих продуктов ориентированы на использование заранее определенных шаблонов на извлечение информации (например, шаблон налоговой декларации или счета-фактуры). Разрабатываемый продукт применяет модели построенные на алгоритмах машинного обучения, которые ориентируются на формирование обучающей выборки на основе прошлой истории классификации документов и извлечения информации вручную. Это позволяет настроить прототип на корректную работу с инструментами автоматически в процессе обучения и без дополнительной настройки шаблонов документов.
Чему научатся студенты? Что самое интересное в проекте?
-Формулировать постановку задачи -Проводить разработку в изменяющихся условиях и требованиях -Участвовать в проекте по разработке прототипа продукта и выводе продукта на рынок (в команде, не индивидуально!) -Применять алгоритмы машинного обучения для статистической обработки финансовой информации -Применять современные техники обработки текстовой информации и извлечения информации (IE - Infromation Extraction)
Организация работы (Как студенты будут работать в команде?)
Организация разработки и взаимодействие на проекте будет построено по Scrum:
- Все студенты участники Scrum команды - Product Owner от OpenTRM - Scrum Master от OpenTRM
Детали и подробности организации на вводных занятиях
Компоненеты (Из каких частей состоит проект?)
test
Какие будут использоваться технологии?
test
Какие начальные требования?
test
Темы вводных занятий
test
Критерии оценки
test
Похожие проекты
test
Контактная информация
test