Распознавание рукописного текста в математических формулах

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Ментор Алексей Никитин
Учебный семестр Осень 2018
Учебный курс 2-й курс
Максимальное количество студентов, выбравших проект: 3



Что за проект?

Разработка системы переводящей строчку аккуратно (или не очень аккуратно) написанной от руки формулы (лексемы имеют явные границы, лексемами являются функции из заданного заранее множества, буквы латинского, греческого алфавита. Распознание конкретной буквы не обязано быть правильным, важно чтобы одинаковые буквы лексемы распознавались одинаково, разные - по разному, распознавание арифметических знаков, показателей и индексов опционально). Результатом распознавания должен быть перевод изображения в специализированный dom.

Другой важной подзадачей является создание интерфейса для компиляции LaTeX текста «на лету», используя библиотеку Khan Academy KaTeX.

Чему я научусь?

Проект дает опыт в компьютерном зрении(методы фильтрации изображений для выравнивания ненужных данных, фрагментации изображения на мелкие части, содержащие лексемы, сверточные нейронные сети для распознавания класса лекмсемы).

Какие начальные требования?

Знание python, математического анализа и теории вероятности, знание стандартных алгоритмов. Для второй подзадачи желательно знать основы LaTeX.

Какие будут использоваться технологии?

  • PyBrain - библиотека для нейронных сетей на python
  • PIL - библиотека для работы с изображениями на python
  • KaTeX - js-библиотека для работы с математическими формулами

Направления развития

Проект может быть хорошим опытом разработки масштабируемых приложений с использованием алгоритмов машинного обучения.

Критерии оценки

Будет объявлено позже

Ориентировочное расписание занятий

  • ПН с 15:00
  • ВТ по предварительной договорённости
  • СР недоступен
  • ЧТ с 13:40
  • ПТ по предварительной договорённости
  • СБ 12:10 - 14:00

Контакты

Алексей Никитин nikitin@cs.msu.su