Автоматизированная идентификация аномалий методами Process Mining

Материал из Wiki - Факультет компьютерных наук
Версия от 14:43, 16 октября 2018; Aapoludnitsin (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск
Компания PwC
Учебный семестр Осень 2018
Учебный курс 3-4-й курс
Максимальное количество студентов, выбравших проект: 3-5



Что это за проект?

Многие компании, в результате автоматизации бизнес-процессов, накапливают большой объём данных в ERP системах. Массивы информации, появляющейся в результате операционной деятельности компаний, могут быть использованы для многих целей, в том числе для анализа фактического состояния бизнес-процессов, а также разработки планов по их улучшению или изменению.
Проект предполагает разработку аналитического инструмента, который направлен на:

  1. автоматизированный анализ бизнес-процессов;
  2. автоматизированная идентификация аномалий с использованием алгоритмов машинного обучения и методов Process Mining.


На входе такой инструмент получает набор табличных данных в виде журнала событий ERP системы по бизнес-процессу. На выходе инструмент формирует отчёт по профилированию процесса, который отражает информацию о наиболее значимых KPI процесса, его узких местах и аномалиях. Так, например, такой инструмент может предоставлять информацию о наиболее часто встречающихся отклонениях от стандартного процесса и потенциальных причинах их появления, а также обнаруживать нетипичные и неоптимальные цепочки событий (например - риск мошенничества, области для оптимизации процесса и т.д.). Впоследствии, на базе данного прототипа планируется разработка инструмента вариативного прогнозирования (Data-driven decision making).

Чему научатся студенты? Что самое интересное в проекте?

  1. Понимать логику и основы построения бизнес-процессов и оценивать риски возникающих отклонений;
  2. Применять алгоритмы машинного обучения для статистической обработки системной информации;
  3. Работать с данными из ERP систем, используемых во всех крупных компаниях (Oracle, SAP, MS Dynamics Axapta etc.);
  4. Определять и формулировать задачи, организовывать время и работу (time- and project – management);
  5. Познакомятся с принципом упорядочивания и очистки данных для анализа - “tidy data”;
  6. Попрактиковаться в написании четкого и понятного кода;
  7. Составления документации по использованию инструмента;
  8. Работать в команде.

Организация работы (Как студенты будут работать в команде?)

Проектная команда состоит из 3-5 человек. В рамках проектной команды предполагаются следующие роли участников (однако список этим не ограничивается):

  1. Специалист по машинному обучению
  2. Специалист по очистке данных
  3. Бизнес-аналитик
  4. Специалист по оценке и анализу рисков
  5. Менеджер проекта
  6. Разработчик
  7. Тестировщик

Каждый участник может попробовать себя в одной или более ролей, совместив, к примеру, роль менеджера проекта и тестировщика. На первоначальном этапе планируется совместная работа по определению масштаба работ и по постановке задач с последующим их распределением.


Компоненты (Из каких частей состоит проект?)

Этапы проекта Этапы разработки Результаты по данному этапу
1 Инициализация Постановка задачи Проектное задание
2 Проектирование  Анализ задачи и моделирование Список допущений, ограничений и рисков реализации проекта
3 Разработка или выбор алгоритма решения задачи
4 Проектирование общей структуры инструмента Структура функциональных модулей

Модель спецификаций и уровней разработки (основа, по которой будет писаться Руководство пользователя)

5 Планирование Планирование основных этапов работ Диаграмма Ганта проекта,

Дорожная карта проекта

6 Реализация Написание кода Четкий, понятный код
7 Отладка и тестирование программы Рабочий прототип инструмента
8 Анализ и работа над полученными результатами Анализ результатов Анализ результатов
9 Документация Руководство пользователя
10 Результат Презентация Презентация разработанного инструмента, оформленная в .ppt и интерактивное демо

Какие будут использоваться технологии?

  1. Python/R или другие;
  2. Реляционные базы данных (MySql, MS SQL etc.);

Какие начальные требования?

  1. Знания одного из языков программирования (Python, R etc.);
  2. Знания теории вероятности и математической статистики;
  3. Знания в области машинного обучения;
  4. Умение работать в Git.

Темы вводных занятий

  1. Process Mining: основные концепции и понятия;
  2. Бизнес аналитика. Виды рисков. Возможные аномалии бизнес-процессов;
  3. Основы управления проектами: методы приоритизации, организации времени и разработки рабочего плана;
  4. Риск-менеджмент в организации;
  5. Принципы работы с очисткой и упорядочивания данных – “tidy data”;
  6. Презентация: структура и навыки.


Критерии оценки

8 – 10: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий ключевые показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. Инструмент должен предусматривать возможность добавления новых аналитических блоков.

6 – 7: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI), информацию об аномалиях и узких местах процесса.

4– 5: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI).

Контактная информация


Yulia Wasserman
PwC, Consultant, Risk Assurance
Office: +79168366786
Email: yulia.wasserman@pwc.com