Классификация и предсказание пользовательских инцидентов (командный проект)
Компания | Kaspersky Lab |
Учебный семестр | Осень 2017 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 3 | |
Содержание
|
Что это за проект?
Дано
Система управления инцидентами, bug-tracker с артфеактами разработки и множество проектов в разработке.
Хочется
Используя методы машинного обучения прогнозировать, какие инциденты могут произойти после выхода новой версии продукта. Для анализа доступна ретроспектива инцидентов случившихся и артефакты разрабатываемого проетка (баги, требования и т.д.). Классифицировать обращения по содержанию.
Зачем
Выявление приоритетных векторов проверки во время приёмки выпускаемых продуктов, избежание рисков при выпуске как следствие.
Что ожидается на выходе
В идеале видится dashboard со сводной информацией. Либо инструмент, позволяющий так или иначе получить набор нужных данных (напр. список рискованных функциональных областей продукта с весами) без представления.
Чему научатся студенты? Что самое интересное в проекте?
Применение классических задач регрессии и классификации в контексте реальной бизнес-задачи.
Организация работы (Как студенты будут работать в команде?)
Можем взять максимум трёх человек, работа сугубо исследовательская, будем собираться минимум раз в неделю для координации работ и обсуждения идей.
Компоненты (Из каких частей состоит проект?)
Какие будут использоваться технологии?
Python, MS SQL Server и Team Foundation Services как источники данных, Atlassian JIRA для ведения задач, RapidMiner (предположительно).
Какие начальные требования?
Python, желательно Transact-SQL, знание или сильное желание разобраться в методах text mining.
Темы вводных занятий
- Специфика задач отдела Business Quality Control
- Проекты компании, приоритетные направления для нас
- Текущие наработки, проблемы с которыми сталкивались в результатах исследования, что имеем сейчас
Критерии оценки
- 4-5: Классификация инцидентов consumer и b2b направлений
- 6-7: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b решениях
- 8-10: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b и b2c решениях. Тематическое моделирование.
Похожие проекты
Whitepapers:
- A Discriminative Model Approach for Accurate Duplicate Bug Report Retrieval - Chengnian Sun, David Lo, Xiaoyin Wang, Jing Jiang, Siau-Cheng Khoo.
- Automatic bug triage using text categorization - Davor Cubranic, Gail C. Murphy.
- Comparing Mining Algorithms for Predicting the Severity of a Reported Bug - Ahmed Lamkanfi, Serge Demeyer, Quinten David Soetens, Tim Verdonckz.
- Identifying Security Bug Reports via Text Mining: An Industrial Case Study - Michael Gegick, Pete Rotella, Tao Xie.
Контактная информация
evgeny.mitroshin@kaspersky.com