Разработка программы для синтаксического анализа текста (проект) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
Sandello (обсуждение | вклад) |
(→Какие будут использоваться технологии?) |
||
Строка 27: | Строка 27: | ||
=== Какие будут использоваться технологии? === | === Какие будут использоваться технологии? === | ||
* C++ / Python в рамках прослушанного курса | * C++ / Python в рамках прослушанного курса | ||
− | * | + | * PostgresSQL |
=== Темы вводных занятий === | === Темы вводных занятий === |
Версия 17:24, 1 декабря 2014
Ментор | Иван Лисенков |
Учебный семестр | Весна 2015 |
Учебный курс | 1-й курс |
Что это за проект?
Программа поиска правил (нечетких высказываний) в произвольном тексте. Полученные Нечеткие высказывания, должны быть сопоставлены с уже ранее найденными, в случае необходимости должны быть сохранены или обновлены нечеткие высказывания в базе знаний. Подобная программа может стать основой для разработки программы поиска нечетких высказываний в интернет.
Программа должна анализировать входную текстовую информацию с целью поиска нечетких логических высказываний вида: Если [не
Чему вы научитесь?
- Формулировать постановку задачи
- Основам теории нечеткой логики (Fuzzy Logic)
- Современным подходам контекстного поиска и синтаксического разбора текста
- Писать надежный и понятный код
- Работать с реляционными базами данных, проектировать модели хранения данных (физическую и логическую)
Какие начальные требования?
Программирование на C/C++/Python (в рамках прослушанного курса)
Какие будут использоваться технологии?
- C++ / Python в рамках прослушанного курса
- PostgresSQL
Темы вводных занятий
- Основы теории нечеткой логики (Нечеткие множества, Нечеткие и Лингвистические переменные, Контроллер на основе нечеткой логики)
- Синтаксический разбор естественного текста
Направления развития
- Использование программы для пополнения базы знаний нечеткими правилами, нечеткими и лингвистическими переменными
- Использование программы совместно с контроллером на основе нечеткой логики (Mamdani, Sugeno)
Критерии оценки
- "удовл” : реализованная и протестированная программа, осуществляющая поиск нечетких высказываний и последующий разбор в виде синтаксического дерева для дальнейшего анализа,
- “хор” : + выделение лингвистических переменных, термов, модифицированных термов, и сопоставление с уже определенными в базе знаний; возможность установления синонимов,
- “отл” : + сохранение выявленных нечетких высказываний в базе знаний, возможность построения цепочек высказываний.