Разработка сервиса классификации и извлечения информации из документов — различия между версиями
м (Ivan.Lisenkov переименовал страницу Test (командный проект) в Разработка сервиса классификации и извлечения информации из документов) |
|||
Строка 1: | Строка 1: | ||
{{Карточка_командного_проекта | {{Карточка_командного_проекта | ||
|name=test | |name=test | ||
− | |company= | + | |company=OpenTRM (Open Trade and Risk Management) |
|semester=Осень 2017 | |semester=Осень 2017 | ||
|course=3 | |course=3 | ||
Строка 9: | Строка 9: | ||
=== Что это за проект? === | === Что это за проект? === | ||
− | + | В рамках данного проекта студентам предлагается участвовать в разработке прототипа продукта/сервиса который осуществляет анализ сканов документов произвольного формата (PDF файлы) для распределения их по заданным классам и извлечения из них необходимой информации. Несмотря на наличие подобных продуктов на рынке, большинство существующих продуктов ориентированы на использование заранее определенных шаблонов на извлечение информации (например, шаблон налоговой декларации или счета-фактуры). Разрабатываемый продукт применяет модели построенные на алгоритмах машинного обучения, которые ориентируются на формирование обучающей выборки на основе прошлой истории классификации документов и извлечения информации вручную. Это позволяет настроить прототип на корректную работу с инструментами автоматически в процессе обучения и без дополнительной настройки шаблонов документов. | |
=== Чему научатся студенты? Что самое интересное в проекте? === | === Чему научатся студенты? Что самое интересное в проекте? === |
Версия 14:56, 18 сентября 2017
Компания | OpenTRM (Open Trade and Risk Management) |
Учебный семестр | Осень 2017 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 3-5 | |
Содержание
|
Что это за проект?
В рамках данного проекта студентам предлагается участвовать в разработке прототипа продукта/сервиса который осуществляет анализ сканов документов произвольного формата (PDF файлы) для распределения их по заданным классам и извлечения из них необходимой информации. Несмотря на наличие подобных продуктов на рынке, большинство существующих продуктов ориентированы на использование заранее определенных шаблонов на извлечение информации (например, шаблон налоговой декларации или счета-фактуры). Разрабатываемый продукт применяет модели построенные на алгоритмах машинного обучения, которые ориентируются на формирование обучающей выборки на основе прошлой истории классификации документов и извлечения информации вручную. Это позволяет настроить прототип на корректную работу с инструментами автоматически в процессе обучения и без дополнительной настройки шаблонов документов.
Чему научатся студенты? Что самое интересное в проекте?
test
Организация работы (Как студенты будут работать в команде?)
test
Компоненеты (Из каких частей состоит проект?)
test
Какие будут использоваться технологии?
test
Какие начальные требования?
test
Темы вводных занятий
test
Критерии оценки
test
Похожие проекты
test
Контактная информация
test