Активный Словарь Онлайн (проект)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Ментор Микулин Николай
Учебный семестр Весна 2016
Учебный курс 1-й курс
Максимальное количество студентов, выбравших проект: 5



Что это за проект?

Активный Словарь Русского Языка - масштабный проект института русского языка им. Виноградова РАН, над которым работают известные лингвисты, включая Юрия Апресяна, Валентину Апресян и Бориса Йомдина. Активный словарь отличается от обычного словаря тем, что он не только объясняет значение слова, но и подробно описывает, как это слово можно использовать. Проблема в том, что на данный момент у словаря нет веб-версии, что в огромное количество раз уменьшает его потенциальную аудиторию.

Наша с вами задача - помочь лингвистам представить миру словарь нового поколения с возможностями сложного поиска и интуитивным интерфейсом.

Чему вы научитесь?

Обрабатывать текстовые данные с помощью Python

Работать с XML-разметкой

Работать с лемматизатором mystem от Яндекса

Создавать веб-приложения на Python с помощью Flask

Создавать интерфейсы для веб-приложений (используя CSS-фреймворки)

+ сможем немного познакомиться с компьютерной лингвистикой и компьютерной лексикографией

Какие начальные требования?

Желание работать в интересном проекте Желание писать аккуратный и понятный код Не стеснятся задавать вопросы ментору Базовые навыки программирования на Python

Какие будут использоваться технологии?

Python Flask MyStem XML HTML CSS и немного Javascript

Темы вводных занятий

Небольшой рассказ о компьютерной лексикографии и о том, откуда взялся наш словарь и почему так важно, чтобы он был в интернете Небольшая презентация - как ресурс выглядит сегодня, какие технологии используем, и что будем делать в рамках проекта

Направления развития

В первую очередь улучшать поиск, добавляя новые параметры и совершенствуя то, что уже написано Улучшать XML-разметку словаря Совершенствовать интерфейс и оформление выдачи

Критерии оценки

4-5 выполнить базовые задачи по приведению сырых текстовых данных в нужный формат 6-7 заработать 4-5 и поучаствовать в разработке веб-приложения 8-10 заработать 6-7 и активно участвовать в разработке самого приложения и интерфейса, и (скорее в качестве бонуса) предлагать интересные решения существующих задач или новые функции

Ориентировочное расписание занятий

Среда 10:30-16:30 Четверг 10:30-15:00 Суббота 10:30-18:00