Разработка программы для синтаксического анализа текста (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница, с помощью формы Новый_проект)
 
 
(не показано 9 промежуточных версии 3 участников)
Строка 2: Строка 2:
 
|name=Разработка программы для синтаксического анализа текста
 
|name=Разработка программы для синтаксического анализа текста
 
|mentor=Иван Лисенков
 
|mentor=Иван Лисенков
|mentor_login={{URLENCODE:{{REVISIONUSER}}|WIKI}}
+
|mentor_login={{URLENCODE:Ivan_Lisenkov|WIKI}}
 
|semester=Весна 2015
 
|semester=Весна 2015
 
|course=1
 
|course=1
 
|summer=
 
|summer=
 
|categorize=yes
 
|categorize=yes
 +
|is_archived=yes
 
}}
 
}}
  
Строка 13: Строка 14:
  
 
Программа должна анализировать входную текстовую информацию с целью поиска нечетких логических высказываний вида:  
 
Программа должна анализировать входную текстовую информацию с целью поиска нечетких логических высказываний вида:  
Если [не
+
 
 +
Если [не|очень|слегка…] <ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ 1> есть <ТЕРМ 1>  [и, или,] <ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ 2> есть <ТЕРМ 2> ... тогда <ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ 3> есть <ТЕРМ 3>
  
 
=== Чему вы научитесь? ===
 
=== Чему вы научитесь? ===
- Формулировать постановку задачи
+
* Формулировать постановку задачи
 
+
* Основам теории нечеткой логики (Fuzzy Logic)
- Основам теории нечеткой логики (Fuzzy Logic)
+
* Современным подходам контекстного поиска и синтаксического разбора текста
 
+
* Писать надежный и понятный код
- Современным подходам контекстного поиска и синтаксического разбора текста
+
* Работать с реляционными базами данных, проектировать модели хранения данных (физическую и логическую)
 
+
- Писать надежный и понятный код
+
 
+
- Работать с реляционными базами данными. Проектировать модели хранения данных (физическую и логическую)
+
  
 
=== Какие начальные требования? ===
 
=== Какие начальные требования? ===
Строка 30: Строка 28:
  
 
=== Какие будут использоваться технологии? ===
 
=== Какие будут использоваться технологии? ===
- C++ / Python в рамках прослушанного курса
+
* C++ / Python в рамках прослушанного курса
 
+
* PostgresSQL
- MySQL/PosgresSQL
+
  
 
=== Темы вводных занятий ===
 
=== Темы вводных занятий ===
- Основы теории нечеткой логики (Нечеткие множества, Нечеткие и Лингвистические переменные, Контроллер на основе нечеткой логики)
+
* Основы теории нечеткой логики (Нечеткие множества, Нечеткие и Лингвистические переменные, Контроллер на основе нечеткой логики)
 
+
* Синтаксический разбор естественного текста
- Синтаксический разбор естественного текста
+
* Работа с реляционными базам данных (проектирование модели хранения данных, написание SQL запросов)
  
 
=== Направления развития ===
 
=== Направления развития ===
- Использование программы для пополнения базы знаний нечеткими правилами, нечеткими и лингвистическими переменными
+
* Использование программы для пополнения базы знаний нечеткими правилами, нечеткими и лингвистическими переменными
- Использование программы совместно с контроллером на основе нечеткой логики (Mamdani, Sugeno)
+
* Использование программы совместно с контроллером на основе нечеткой логики (Mamdani, Sugeno) для поддержки принятия решений
  
 
=== Критерии оценки ===
 
=== Критерии оценки ===
"удовл” : реализованная и протестированная программа осуществляющая поиск нечетких высказываний и последующих разбор в виде синтаксического дерева для дальнейшего анализа
+
* 4-5 : реализованная и протестированная программа, осуществляющая поиск нечетких высказываний и последующий разбор в виде синтаксического дерева для дальнейшего анализа,
 
+
* 6-7 : Дополнительно, выделение лингвистических переменных, термов, модифицированных термов, и сопоставление с уже определенными в базе знаний;
“хор” : +выделение лингвистических переменных, термов, модифицированных термов и сопоставление с уже определенными в базе знаний. Возможность установления синонимов
+
* 8-10 : Дополнительно, сохранение выявленных нечетких высказываний в базе знаний.
 
+
“отл” : +сохранение выявленных нечетких высказываний в базе знаний, возможность построения цепочек высказываний
+

Текущая версия на 10:49, 20 октября 2015

Ментор Иван Лисенков
Учебный семестр Весна 2015
Учебный курс 1-й курс


Внимание! Данный проект находится в архиве и реализован не будет.

Что это за проект?

Программа поиска правил (нечетких высказываний) в произвольном тексте. Полученные Нечеткие высказывания, должны быть сопоставлены с уже ранее найденными, в случае необходимости должны быть сохранены или обновлены нечеткие высказывания в базе знаний. Подобная программа может стать основой для разработки программы поиска нечетких высказываний в интернет.

Программа должна анализировать входную текстовую информацию с целью поиска нечетких логических высказываний вида:

Если [не|очень|слегка…] <ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ 1> есть <ТЕРМ 1> [и, или,] <ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ 2> есть <ТЕРМ 2> ... тогда <ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ 3> есть <ТЕРМ 3>

Чему вы научитесь?

  • Формулировать постановку задачи
  • Основам теории нечеткой логики (Fuzzy Logic)
  • Современным подходам контекстного поиска и синтаксического разбора текста
  • Писать надежный и понятный код
  • Работать с реляционными базами данных, проектировать модели хранения данных (физическую и логическую)

Какие начальные требования?

Программирование на C/C++/Python (в рамках прослушанного курса)

Какие будут использоваться технологии?

  • C++ / Python в рамках прослушанного курса
  • PostgresSQL

Темы вводных занятий

  • Основы теории нечеткой логики (Нечеткие множества, Нечеткие и Лингвистические переменные, Контроллер на основе нечеткой логики)
  • Синтаксический разбор естественного текста
  • Работа с реляционными базам данных (проектирование модели хранения данных, написание SQL запросов)

Направления развития

  • Использование программы для пополнения базы знаний нечеткими правилами, нечеткими и лингвистическими переменными
  • Использование программы совместно с контроллером на основе нечеткой логики (Mamdani, Sugeno) для поддержки принятия решений

Критерии оценки

  • 4-5 : реализованная и протестированная программа, осуществляющая поиск нечетких высказываний и последующий разбор в виде синтаксического дерева для дальнейшего анализа,
  • 6-7 : Дополнительно, выделение лингвистических переменных, термов, модифицированных термов, и сопоставление с уже определенными в базе знаний;
  • 8-10 : Дополнительно, сохранение выявленных нечетких высказываний в базе знаний.