Автоматизированная идентификация аномалий методами Process Mining
Компания | PwC |
Учебный семестр | Осень 2018 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 3-5 | |
Что это за проект?
Многие компании, в результате автоматизации бизнес-процессов, накапливают большой объём данных в ERP системах. Массивы информации, появляющейся в результате операционной деятельности компаний, могут быть использованы для многих целей, в том числе для анализа фактического состояния бизнес-процессов, а также разработки планов по их улучшению или изменению.
Проект предполагает разработку аналитического инструмента, который направлен на:
- автоматизированный анализ бизнес-процессов;
- автоматизированная идентификация аномалий с использованием алгоритмов машинного обучения и методов Process Mining.
На входе такой инструмент получает набор табличных данных в виде журнала событий ERP системы по бизнес-процессу. На выходе инструмент формирует отчёт по профилированию процесса, который отражает информацию о наиболее значимых KPI процесса, его узких местах и аномалиях. Так, например, такой инструмент может предоставлять информацию о наиболее часто встречающихся отклонениях от стандартного процесса и потенциальных причинах их появления, а также обнаруживать нетипичные и неоптимальные цепочки событий (например - риск мошенничества, области для оптимизации процесса и т.д.). Впоследствии, на базе данного прототипа планируется разработка инструмента вариативного прогнозирования (Data-driven decision making).
Чему научатся студенты? Что самое интересное в проекте?
- Понимать логику и основы построения бизнес-процессов и оценивать риски возникающих отклонений;
- Применять алгоритмы машинного обучения для статистической обработки системной информации;
- Работать с данными из ERP систем, используемых во всех крупных компаниях (Oracle, SAP, MS Dynamics Axapta etc.);
- Определять и формулировать задачи, организовывать время и работу (time- and project – management);
- Познакомятся с принципом упорядочивания и очистки данных для анализа - “tidy data”;
- Попрактиковаться в написании четкого и понятного кода;
- Составления документации по использованию инструмента;
- Работать в команде.
Организация работы (Как студенты будут работать в команде?)
Проектная команда состоит из 3-5 человек. В рамках проектной команды предполагаются следующие роли участников (однако список этим не ограничивается):
- Специалист по машинному обучению
- Специалист по очистке данных
- Бизнес-аналитик
- Специалист по оценке и анализу рисков
- Менеджер проекта
- Разработчик
- Тестировщик
Каждый участник может попробовать себя в одной или более ролей, совместив, к примеру, роль менеджера проекта и тестировщика. На первоначальном этапе планируется совместная работа по определению масштаба работ и по постановке задач с последующим их распределением.
Компоненты (Из каких частей состоит проект?)
№ | Этапы проекта | Этапы разработки | Результаты по данному этапу |
---|---|---|---|
1 | Инициализация | Постановка задачи | Проектное задание |
2 | Проектирование | Анализ задачи и моделирование | Список допущений, ограничений и рисков реализации проекта |
3 | Разработка или выбор алгоритма решения задачи | ||
4 | Проектирование общей структуры инструмента | Структура функциональных модулей
Модель спецификаций и уровней разработки (основа, по которой будет писаться Руководство пользователя) | |
5 | Планирование | Планирование основных этапов работ | Диаграмма Ганта проекта,
Дорожная карта проекта |
6 | Реализация | Написание кода | Четкий, понятный код |
7 | Отладка и тестирование программы | Рабочий прототип инструмента | |
8 | Анализ и работа над полученными результатами | Анализ результатов | Анализ результатов |
9 | Документация | Руководство пользователя | |
10 | Результат | Презентация | Презентация разработанного инструмента, оформленная в .ppt и интерактивное демо |
Какие будут использоваться технологии?
- Python/R или другие;
- Реляционные базы данных (MySql, MS SQL etc.);
Какие начальные требования?
- Знания одного из языков программирования (Python, R etc.);
- Знания теории вероятности и математической статистики;
- Знания в области машинного обучения;
- Умение работать в Git.
Темы вводных занятий
- Process Mining: основные концепции и понятия;
- Бизнес аналитика. Виды рисков. Возможные аномалии бизнес-процессов;
- Основы управления проектами: методы приоритизации, организации времени и разработки рабочего плана;
- Риск-менеджмент в организации;
- Принципы работы с очисткой и упорядочивания данных – “tidy data”;
- Презентация: структура и навыки.
Критерии оценки
8 – 10: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий ключевые показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. Инструмент должен предусматривать возможность добавления новых аналитических блоков.
6 – 7: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI), информацию об аномалиях и узких местах процесса.
4– 5: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI).
Контактная информация
Yulia Wasserman
PwC, Consultant, Risk Assurance
Office: +79168366786
Email: yulia.wasserman@pwc.com