Разработка сервиса классификации и извлечения информации из документов — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Организация работы (Как студенты будут работать в команде?))
Строка 19: Строка 19:
  
 
=== Организация работы (Как студенты будут работать в команде?) ===
 
=== Организация работы (Как студенты будут работать в команде?) ===
test
+
Организация разработки и взаимодействие на проекте будет построено по Scrum:
 +
 
 +
- Все студенты участники Scrum команды
 +
- Product Owner от OpenTRM
 +
- Scrum Master от OpenTRM
 +
 
 +
Детали и подробности организации на вводных занятиях
  
 
=== Компоненеты (Из каких частей состоит проект?) ===
 
=== Компоненеты (Из каких частей состоит проект?) ===

Версия 14:57, 18 сентября 2017

Компания OpenTRM (Open Trade and Risk Management)
Учебный семестр Осень 2017
Учебный курс 3-й курс
Максимальное количество студентов, выбравших проект: 3-5



Что это за проект?

В рамках данного проекта студентам предлагается участвовать в разработке прототипа продукта/сервиса который осуществляет анализ сканов документов произвольного формата (PDF файлы) для распределения их по заданным классам и извлечения из них необходимой информации. Несмотря на наличие подобных продуктов на рынке, большинство существующих продуктов ориентированы на использование заранее определенных шаблонов на извлечение информации (например, шаблон налоговой декларации или счета-фактуры). Разрабатываемый продукт применяет модели построенные на алгоритмах машинного обучения, которые ориентируются на формирование обучающей выборки на основе прошлой истории классификации документов и извлечения информации вручную. Это позволяет настроить прототип на корректную работу с инструментами автоматически в процессе обучения и без дополнительной настройки шаблонов документов.

Чему научатся студенты? Что самое интересное в проекте?

-Формулировать постановку задачи -Проводить разработку в изменяющихся условиях и требованиях -Участвовать в проекте по разработке прототипа продукта и выводе продукта на рынок (в команде, не индивидуально!) -Применять алгоритмы машинного обучения для статистической обработки финансовой информации -Применять современные техники обработки текстовой информации и извлечения информации (IE - Infromation Extraction)

Организация работы (Как студенты будут работать в команде?)

Организация разработки и взаимодействие на проекте будет построено по Scrum:

- Все студенты участники Scrum команды - Product Owner от OpenTRM - Scrum Master от OpenTRM

Детали и подробности организации на вводных занятиях

Компоненеты (Из каких частей состоит проект?)

test

Какие будут использоваться технологии?

test

Какие начальные требования?

test

Темы вводных занятий

test

Критерии оценки

test

Похожие проекты

test

Контактная информация

test