Семантические траектории текстов естественного языка
Компания | НИУ ВШЭ |
Учебный семестр | Осень 2018 |
Учебный курс | 2-4-й курс |
Максимальное количество студентов, выбравших проект: 2-3 | |
Что это за проект?
Представление слов с помощью преобразования word-to-vec позволяет поставить в соответствие слову естественного языка в многомерный вектор и тем самым превратить литературный текст во временной ряд. Оценивая характеристики этого ряда можно оценить литературный текст, как на глобальном, так и на локальном уровне.
Важно. Проект требует много времени. Подразумевается большое количество вычислений и самостоятельные исследования.
Чему вы научитесь?
- Эффективно осуществлять преобразование word-to-vec.
- Вычислять характеристики хаотических временных рядов.
- Строить системы автоматической оценки качества перевода.
- Оценивать “слом” КВНовской шутки (приём, собственно обеспечивающий юмористический эффект).
В дополнение к этому:
- Проектировать объектно-ориентированные системы.
- Работать с математической литературой на английском и русском языке, превращая свинец в золото сложные математические теории в алгоритмы и, далее, в программный код.
<
Темы вводных занятий
На занятиях будут рассматриваться необходимые теоретические положения, обсуждаться проблемы, возникающие при разработке алгоритмов и реализации систем, сравниваться и анализироваться результаты, полученные участниками проекта, а также результаты, представленные в литературе.
Направления развития
- Создание и разработка прикладных систем для данной задачи.
- Создание новых алгоритмов данного класса.
- Написание научной статьи.
Указанные направления можно развивать также в рамках дипломных работ.
Какие начальные требования?
Знание основ объектно-ориентированного программирования, владение английским языком на уровне чтения математического текста, знание основ анализа данных приветствуется, но не является обязательным.
Какие будут использоваться технологии?
При программной реализации Вы можете использовать любой объектно-ориентированный язык программирования, который Вам удобен.
Критерии оценки
1-3: произведено знакомство с литературой.
4-5: построен алгоритм.
6-8: построен алгоритм и разработан работающий программный код, позволяющий как-то решать поставленную задачу.
9-10: построен алгоритм и разработан работающий программный код, позволяющий эффективно решать поставленную задачу.
Ориентировочное расписание занятий
Расписания будут проходить в здании ФКН ВШЭ, к. 314; по средам и пятницам, 18.00-20.00. В случае необходимости будет назначаться дополнительное время.
Контакты
Громов Василий stroller@rambler.ru