Активный Словарь Онлайн (проект)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Ментор Микулин Николай
Учебный семестр Весна 2016
Учебный курс 1-й курс
Максимальное количество студентов, выбравших проект: 5



Что это за проект?

Активный Словарь Русского Языка - масштабный проект института русского языка им. Виноградова РАН,
над которым работают известные лингвисты, включая Юрия Апресяна, Валентину Апресян и Бориса Йомдина.
Активный словарь отличается от обычного словаря тем, что он не только объясняет значение слова,
но и подробно описывает, как это слово можно использовать.

Проблема в том, что на данный момент у словаря нет веб-версии,
что в огромное количество раз уменьшает его потенциальную аудиторию.

Наша с вами задача - помочь лингвистам представить миру словарь нового поколения
с возможностями сложного поиска и интуитивным интерфейсом.

Чему вы научитесь?

Обрабатывать текстовые данные с помощью Python

Работать с XML-разметкой

Работать с лемматизатором mystem от Яндекса

Создавать веб-приложения на Python с помощью Flask

Создавать интерфейсы для веб-приложений (используя CSS-фреймворки)

+ сможем немного познакомиться с компьютерной лингвистикой и компьютерной лексикографией

Какие начальные требования?

Желание работать в интересном проекте

Желание писать аккуратный и понятный код

Не стеснятся задавать вопросы ментору

Базовые навыки программирования на Python

Какие будут использоваться технологии?

Python

Flask

MyStem

XML

HTML

CSS и немного Javascript

Темы вводных занятий

Небольшой рассказ о компьютерной лексикографии и о том, откуда взялся наш словарь и почему так важно, чтобы он был в интернете

Небольшая презентация - как ресурс выглядит сегодня, какие технологии используем, и что будем делать в рамках проекта

Направления развития

В первую очередь улучшать поиск, добавляя новые параметры и совершенствуя то, что уже написано

Улучшать XML-разметку словаря

Совершенствовать интерфейс и оформление выдачи

Критерии оценки

4-5 выполнить базовые задачи по приведению сырых текстовых данных в нужный формат

6-7 заработать 4-5 и поучаствовать в разработке веб-приложения

8-10 заработать 6-7 и активно участвовать в разработке самого приложения и интерфейса,

и (скорее в качестве бонуса) предлагать интересные решения существующих задач или новые функции

Ориентировочное расписание занятий

Среда 10:30-16:30

Четверг 10:30-15:00

Суббота 10:30-18:00