Классификация и предсказание пользовательских инцидентов (командный проект)

Материал из Wiki - Факультет компьютерных наук
Версия от 18:17, 2 октября 2017; Emitroshin (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск
Компания Kaspersky Lab
Учебный семестр Осень 2017
Учебный курс 3-й курс
Максимальное количество студентов, выбравших проект: 3



Что это за проект?

Дано: Система управления инцидентами, bug-tracker с артфеактами разработки и множество проектов в разработке.

Хочется: Используя методы машинного обучения прогнозировать, какие инциденты могут произойти после выхода новой версии продукта. Для анализа доступна ретроспектива инцидентов случившихся и артефакты разрабатываемого проетка (баги, требования и т.д.). Классифицировать обращения по содержанию.

Зачем: Выявление приоритетных векторов проверки во время приёмки выпускаемых продуктов, избежание рисков при выпуске как следствие.

Что ожидается на выходе: В идеале видится dashboard со сводной информацией. Либо инструмент, позволяющий так или иначе получить набор нужных данных (напр. список рискованных функциональных областей продукта с весами) без представления.

Чему научатся студенты? Что самое интересное в проекте?

Применение классических задач регрессии и классификации в контексте реальной бизнес-задачи.

Организация работы (Как студенты будут работать в команде?)

Можем взять максимум трёх человек, работа сугубо исследовательская, будем собираться минимум раз в неделю для координации работ и обсуждения идей.

Компоненеты (Из каких частей состоит проект?)

Какие будут использоваться технологии?

Python, MS SQL Server и Team Foundation Services как источники данных, Atlassian JIRA для ведения задач, RapidMiner (предположительно).

Какие начальные требования?

Python, желательно Transact-SQL, знание или сильное желание разобраться в методах text mining.

Темы вводных занятий

- Специфика задач отдела Business Quality Control - Проекты компании, приоритетные направления для нас - Текущие наработки, проблемы с которыми сталкивались в результатах исследования, что имеем сейчас

Критерии оценки

4-5: Классификация инцидентов consumer и b2b направлений 6-7: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b решениях 8-10: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b и b2c решениях. Тематическое моделирование.

Похожие проекты

Whitepapers: A Discriminative Model Approach for Accurate Duplicate Bug Report Retrieval - Chengnian Sun, David Lo, Xiaoyin Wang, Jing Jiang, Siau-Cheng Khoo. Automatic bug triage using text categorization - Davor Cubranic, Gail C. Murphy. Comparing Mining Algorithms for Predicting the Severity of a Reported Bug - Ahmed Lamkanfi, Serge Demeyer, Quinten David Soetens, Tim Verdonckz. Identifying Security Bug Reports via Text Mining: An Industrial Case Study - Michael Gegick, Pete Rotella, Tao Xie.

Контактная информация

evgeny.mitroshin@kaspersky.com