Активный Словарь Онлайн (проект)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Ментор Микулин Николай
Учебный семестр Весна 2016
Учебный курс 1-й курс
Максимальное количество студентов, выбравших проект: 5



Что это за проект?

Активный Словарь Русского Языка - масштабный проект института русского языка им. Виноградова РАН,
над которым работают известные лингвисты, включая Юрия Апресяна, Валентину Апресян и Бориса Йомдина.
Активный словарь отличается от обычного словаря тем, что он не только объясняет значение слова,
но и подробно описывает, как это слово можно использовать.

Проблема в том, что на данный момент у словаря нет веб-версии,
что в огромное количество раз уменьшает его потенциальную аудиторию.

Наша с вами задача - помочь лингвистам представить миру словарь нового поколения
с возможностями сложного поиска и интуитивным интерфейсом.

презентация проекта

Чему вы научитесь?

  • Обрабатывать текстовые данные с помощью Python
  • Работать с XML-разметкой
  • Работать с лемматизатором mystem от Яндекса
  • Создавать веб-приложения на Python с помощью Flask
  • Создавать интерфейсы для веб-приложений (используя CSS-фреймворки)

+ сможем немного познакомиться с компьютерной лингвистикой и компьютерной лексикографией

Какие начальные требования?

  • Желание работать в интересном проекте и приобрести новые навыки
  • Никогда не стеснятся задавать вопросы ментору
  • Базовые навыки программирования на Python

Какие будут использоваться технологии?

  • Python
  • Flask
  • MyStem
  • XML
  • HTML
  • CSS

и немного Javascript.

Темы вводных занятий

  • Небольшой рассказ о компьютерной лексикографии и о том, откуда взялся наш словарь и почему так важно, чтобы он был в интернете
  • Небольшая презентация - как ресурс выглядит сегодня, какие технологии используем, и что будем делать в рамках проекта

Направления развития

  • В первую очередь улучшать поиск, добавляя новые параметры и совершенствуя то, что уже написано
  • Улучшать XML-разметку словаря
  • Совершенствовать интерфейс и оформление выдачи

Критерии оценки

4-5: выполнить базовые задачи по приведению сырых текстовых данных в нужный формат

6-7: заработать 4-5 и поучаствовать в разработке веб-приложения

8-10: заработать 6-7 и активно участвовать в разработке самого приложения и интерфейса,

и (скорее в качестве бонуса) предлагать интересные решения существующих задач или новые функции.

Ориентировочное расписание занятий

СР: 10:30-16:30

ЧТ: 10:30-15:00

СБ: 10:30-18:00