Классификация и предсказание пользовательских инцидентов (командный проект)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Компания Kaspersky Lab
Учебный семестр Осень 2017
Учебный курс 3-й курс
Максимальное количество студентов, выбравших проект: 3



Что это за проект?

Дано

Система управления инцидентами, bug-tracker с артфеактами разработки и множество проектов в разработке.

Хочется

Используя методы машинного обучения прогнозировать, какие инциденты могут произойти после выхода новой версии продукта. Для анализа доступна ретроспектива инцидентов случившихся и артефакты разрабатываемого проетка (баги, требования и т.д.). Классифицировать обращения по содержанию.

Зачем

Выявление приоритетных векторов проверки во время приёмки выпускаемых продуктов, избежание рисков при выпуске как следствие.

Что ожидается на выходе

В идеале видится dashboard со сводной информацией. Либо инструмент, позволяющий так или иначе получить набор нужных данных (напр. список рискованных функциональных областей продукта с весами) без представления.

Чему научатся студенты? Что самое интересное в проекте?

Применение классических задач регрессии и классификации в контексте реальной бизнес-задачи.

Организация работы (Как студенты будут работать в команде?)

Можем взять максимум трёх человек, работа сугубо исследовательская, будем собираться минимум раз в неделю для координации работ и обсуждения идей.

Компоненты (Из каких частей состоит проект?)

Какие будут использоваться технологии?

Python, MS SQL Server и Team Foundation Services как источники данных, Atlassian JIRA для ведения задач, RapidMiner (предположительно).

Какие начальные требования?

Python, желательно Transact-SQL, знание или сильное желание разобраться в методах text mining.

Темы вводных занятий

  1. Специфика задач отдела Business Quality Control
  2. Проекты компании, приоритетные направления для нас
  3. Текущие наработки, проблемы с которыми сталкивались в результатах исследования, что имеем сейчас

Критерии оценки

  • 4-5: Классификация инцидентов consumer и b2b направлений
  • 6-7: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b решениях
  • 8-10: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b и b2c решениях. Тематическое моделирование.

Похожие проекты

Whitepapers:

  • A Discriminative Model Approach for Accurate Duplicate Bug Report Retrieval - Chengnian Sun, David Lo, Xiaoyin Wang, Jing Jiang, Siau-Cheng Khoo.
  • Automatic bug triage using text categorization - Davor Cubranic, Gail C. Murphy.
  • Comparing Mining Algorithms for Predicting the Severity of a Reported Bug - Ahmed Lamkanfi, Serge Demeyer, Quinten David Soetens, Tim Verdonckz.
  • Identifying Security Bug Reports via Text Mining: An Industrial Case Study - Michael Gegick, Pete Rotella, Tao Xie.

Контактная информация

evgeny.mitroshin@kaspersky.com