Разработка модуля распознавания текста из видеоизображения (проект)
Ментор | Королев Денис |
Учебный семестр | Осень 2017 |
Учебный курс | 2-й курс |
Проект можно развивать на летней практике | |
Максимальное количество студентов, выбравших проект: 5-10 | |
Что это за проект?
Распознавание текста из видео/фото изображений дополняет сервис распознавания голоса из аудио и видео (как файлов, так и потоков).
Основная область применения -- мониторинг телевизионных программ различными мониторинговыми службами. Основной объект для распознавания -- бегущие строки и субтитры (lower thirds), но на деле объекты могут быть не только текстовыми (вылавливать логотипы и другие эталонные изображения и надписи, регистрировать их размер).
Чему вы научитесь?
Обработка видеопотоков, файлов и фотоизображений с целью распознавания текстов и изображений по заданным шаблонам.
Какие начальные требования?
В зависимости от роли в проекте:
- OpenCV и навыки работы с распознаванием изображений.
- Веб-разработка на Ruby on Rails
Какие будут использоваться технологии?
- Разработка на Ruby on Rails, JavaScript
- Распознавание -- OpenCV + C++/Python
- API GoogleDrive, работа с хранилищами FTP/WebDAV
Темы вводных занятий
Не в порядке изложения:
1. Архитектура проекта. API, внешние связи и зависимости.
2. Специфические технологии и используемые инструменты.
3. Доступные ресурсы, организация доступа.
4. Разделение ролей
Направления развития
Графическая часть сервиса распознавания дополняет голосовую (изначально это сервис распознавания голоса в текст), также там предусмотрено подключение перевода. Комплексная услуга позволяет покрывать значительную часть запросов, но требует и более тщательной разработки интерфейса пользователя, и сами "распознаватели" зачастую требуется дублировать и перепроверять возможными автоматическими способами, чтобы снизить уровень ошибок. Проект развивается в настоящее время в сторону комплексного сервиса, обслуживающего как запросы частных клиентов, так и интегрируемого в корпоративный рабочий процесс, в т. ч. для профильных компаний (медиаизмерители, HR, колцентры, журналисты, продакшены и тд).
Критерии оценки
Про работу и оценки почитайте здесь: https://d.pr/143bq
Постарайтесь отнестись к этому с пониманием. Очень часто бодрое начало длится 3-4 недели и потом наступает тишина. Очень хочется, чтобы проекты доводились до запуска, а вы получали опыт успешной разработки и, возможно, работу в этих проектах уже в другом статусе. Но пока это для вас учебная работа, поэтому будем придерживаться описанных по ссылке правил и критериев. Спасибо!
Как записаться?
В общем доступе есть порядка двадцати проектов, относящихся к области видеотехнологий (стриминг, доставка потоков и т.д.). Чтобы всем было проще, эти проекты объединим в четыре группы и при записи на проект выбирайте группу, а конкретный проект и вашу роль в нем мы обсудим уже в рабочем порядке.
Ориентировочное расписание занятий
Более точное расписание будет ясно после утверждения графика факультативов, пока ориентируемся на вторник, среду или пятницу во второй половине дня (после 15-16 часов).
На самом деле, для общения (как индивидуального, так и группового) удобно использовать средства видеосвязи -- это не заменяет очных встреч, но отлично дополняет их за счет возможности оперативно решать задачи "здесь и сейчас", сидя за удобным вам рабочим местом. Практически все темы проектов подразумевают работу в сети.
Денис Королев,
https://www.hse.ru/staff/dkorolev (там есть ссылки на соцсети)
+7 903 610 3290 (месенджеры по вкусу)
d.korolev@gmail.com