Классификация и предсказание пользовательских инцидентов (командный проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (reformatted)
м (fixed typo)
 
(не показаны 2 промежуточные версии этого же участника)
Строка 9: Строка 9:
  
 
=== Что это за проект? ===
 
=== Что это за проект? ===
Дано:
+
===== Дано =====
 
Система управления инцидентами, bug-tracker с артфеактами разработки и множество проектов в разработке.
 
Система управления инцидентами, bug-tracker с артфеактами разработки и множество проектов в разработке.
  
Хочется:
+
===== Хочется =====
 
Используя методы машинного обучения прогнозировать, какие инциденты могут произойти после выхода новой версии продукта.
 
Используя методы машинного обучения прогнозировать, какие инциденты могут произойти после выхода новой версии продукта.
 
Для анализа доступна ретроспектива инцидентов случившихся и артефакты разрабатываемого проетка (баги, требования и т.д.).
 
Для анализа доступна ретроспектива инцидентов случившихся и артефакты разрабатываемого проетка (баги, требования и т.д.).
 
Классифицировать обращения по содержанию.
 
Классифицировать обращения по содержанию.
  
Зачем:
+
===== Зачем =====
 
Выявление приоритетных векторов проверки во время приёмки выпускаемых продуктов, избежание рисков при выпуске как следствие.
 
Выявление приоритетных векторов проверки во время приёмки выпускаемых продуктов, избежание рисков при выпуске как следствие.
  
Что ожидается на выходе:
+
===== Что ожидается на выходе =====
 
В идеале видится dashboard со сводной информацией. Либо инструмент, позволяющий так или иначе получить набор нужных данных (напр. список рискованных функциональных областей продукта с весами) без представления.
 
В идеале видится dashboard со сводной информацией. Либо инструмент, позволяющий так или иначе получить набор нужных данных (напр. список рискованных функциональных областей продукта с весами) без представления.
  
Строка 29: Строка 29:
 
Можем взять максимум трёх человек, работа сугубо исследовательская, будем собираться минимум раз в неделю для координации работ и обсуждения идей.
 
Можем взять максимум трёх человек, работа сугубо исследовательская, будем собираться минимум раз в неделю для координации работ и обсуждения идей.
  
=== Компоненеты (Из каких частей состоит проект?) ===
+
=== Компоненты (Из каких частей состоит проект?) ===
 
+
  
 
=== Какие будут использоваться технологии? ===
 
=== Какие будут использоваться технологии? ===
Строка 50: Строка 49:
 
=== Похожие проекты ===
 
=== Похожие проекты ===
 
Whitepapers:
 
Whitepapers:
A Discriminative Model Approach for Accurate Duplicate Bug Report Retrieval - Chengnian Sun, David Lo, Xiaoyin Wang, Jing Jiang, Siau-Cheng Khoo.
+
* A Discriminative Model Approach for Accurate Duplicate Bug Report Retrieval - Chengnian Sun, David Lo, Xiaoyin Wang, Jing Jiang, Siau-Cheng Khoo.
Automatic bug triage using text categorization - Davor Cubranic, Gail C. Murphy.
+
* Automatic bug triage using text categorization - Davor Cubranic, Gail C. Murphy.
Comparing Mining Algorithms for Predicting the Severity of a Reported Bug - Ahmed Lamkanfi, Serge Demeyer, Quinten David Soetens, Tim Verdonckz.
+
* Comparing Mining Algorithms for Predicting the Severity of a Reported Bug - Ahmed Lamkanfi, Serge Demeyer, Quinten David Soetens, Tim Verdonckz.
Identifying Security Bug Reports via Text Mining: An Industrial Case Study - Michael Gegick, Pete Rotella, Tao Xie.
+
* Identifying Security Bug Reports via Text Mining: An Industrial Case Study - Michael Gegick, Pete Rotella, Tao Xie.
  
 
=== Контактная информация ===
 
=== Контактная информация ===
 
evgeny.mitroshin@kaspersky.com
 
evgeny.mitroshin@kaspersky.com

Текущая версия на 18:25, 2 октября 2017

Компания Kaspersky Lab
Учебный семестр Осень 2017
Учебный курс 3-й курс
Максимальное количество студентов, выбравших проект: 3



Что это за проект?

Дано

Система управления инцидентами, bug-tracker с артфеактами разработки и множество проектов в разработке.

Хочется

Используя методы машинного обучения прогнозировать, какие инциденты могут произойти после выхода новой версии продукта. Для анализа доступна ретроспектива инцидентов случившихся и артефакты разрабатываемого проетка (баги, требования и т.д.). Классифицировать обращения по содержанию.

Зачем

Выявление приоритетных векторов проверки во время приёмки выпускаемых продуктов, избежание рисков при выпуске как следствие.

Что ожидается на выходе

В идеале видится dashboard со сводной информацией. Либо инструмент, позволяющий так или иначе получить набор нужных данных (напр. список рискованных функциональных областей продукта с весами) без представления.

Чему научатся студенты? Что самое интересное в проекте?

Применение классических задач регрессии и классификации в контексте реальной бизнес-задачи.

Организация работы (Как студенты будут работать в команде?)

Можем взять максимум трёх человек, работа сугубо исследовательская, будем собираться минимум раз в неделю для координации работ и обсуждения идей.

Компоненты (Из каких частей состоит проект?)

Какие будут использоваться технологии?

Python, MS SQL Server и Team Foundation Services как источники данных, Atlassian JIRA для ведения задач, RapidMiner (предположительно).

Какие начальные требования?

Python, желательно Transact-SQL, знание или сильное желание разобраться в методах text mining.

Темы вводных занятий

  1. Специфика задач отдела Business Quality Control
  2. Проекты компании, приоритетные направления для нас
  3. Текущие наработки, проблемы с которыми сталкивались в результатах исследования, что имеем сейчас

Критерии оценки

  • 4-5: Классификация инцидентов consumer и b2b направлений
  • 6-7: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b решениях
  • 8-10: Классификация инцидентов consumer и b2b направлений + прогнозирование проблем в флагманских b2b и b2c решениях. Тематическое моделирование.

Похожие проекты

Whitepapers:

  • A Discriminative Model Approach for Accurate Duplicate Bug Report Retrieval - Chengnian Sun, David Lo, Xiaoyin Wang, Jing Jiang, Siau-Cheng Khoo.
  • Automatic bug triage using text categorization - Davor Cubranic, Gail C. Murphy.
  • Comparing Mining Algorithms for Predicting the Severity of a Reported Bug - Ahmed Lamkanfi, Serge Demeyer, Quinten David Soetens, Tim Verdonckz.
  • Identifying Security Bug Reports via Text Mining: An Industrial Case Study - Michael Gegick, Pete Rotella, Tao Xie.

Контактная информация

evgeny.mitroshin@kaspersky.com