Автоматизированная идентификация аномалий методами Process Mining — различия между версиями
(Новая страница: «{{Карточка_командного_проекта |name=Автоматизированная идентификация аномалий методами Pro…») |
|||
Строка 7: | Строка 7: | ||
|categorize=yes | |categorize=yes | ||
}} | }} | ||
+ | |||
+ | ===Что это за проект? === | ||
+ | |||
+ | Многие компании, в результате автоматизации бизнес-процессов, накапливают большой объём данных в ERP системах. Массивы информации, появляющейся в результате операционной деятельности компаний, могут быть использованы для многих целей, в том числе для анализа фактического состояния бизнес-процессов, а также разработки планов по их улучшению или изменению. | ||
+ | <br/>Проект предполагает разработку аналитического инструмента, который направлен на: | ||
+ | # автоматизированный анализ бизнес-процессов; | ||
+ | # автоматизированная идентификация аномалий с использованием алгоритмов машинного обучения и методов Process Mining. | ||
+ | <br/> | ||
+ | На входе такой инструмент получает набор табличных данных в виде журнала событий ERP системы по бизнес-процессу. На выходе инструмент формирует отчёт по профилированию процесса, который отражает информацию о наиболее значимых KPI процесса, его узких местах и аномалиях. Так, например, такой инструмент может предоставлять информацию о наиболее часто встречающихся отклонениях от стандартного процесса и потенциальных причинах их появления, а также обнаруживать нетипичные и неоптимальные цепочки событий (например - риск мошенничества, области для оптимизации процесса и т.д.). Впоследствии, на базе данного прототипа планируется разработка инструмента вариативного прогнозирования (Data-driven decision making). | ||
+ | |||
+ | ===Чему научатся студенты? Что самое интересное в проекте? === | ||
+ | |||
+ | # Понимать логику и основы построения бизнес-процессов и оценивать риски возникающих отклонений; | ||
+ | # Применять алгоритмы машинного обучения для статистической обработки системной информации; | ||
+ | # Работать с данными из ERP систем, используемых во всех крупных компаниях (Oracle, SAP, MS Dynamics Axapta etc.); | ||
+ | # Определять и формулировать задачи, организовывать время и работу (time- and project – management); | ||
+ | # Познакомятся с принципом упорядочивания и очистки данных для анализа - “tidy data”; | ||
+ | # Попрактиковаться в написании четкого и понятного кода; | ||
+ | # Составления документации по использованию инструмента; | ||
+ | # Работать в команде. | ||
+ | |||
+ | ===Организация работы (Как студенты будут работать в команде?) === | ||
+ | Проектная команда состоит из 3-5 человек. В рамках проектной команды предполагаются следующие роли участников (однако список этим не ограничивается): | ||
+ | |||
+ | # Специалист по машинному обучению | ||
+ | # Специалист по очистке данных | ||
+ | # Бизнес-аналитик | ||
+ | # Специалист по оценке и анализу рисков | ||
+ | # Менеджер проекта | ||
+ | # Разработчик | ||
+ | # Тестировщик | ||
+ | |||
+ | Каждый участник может попробовать себя в одной или более ролей, совместив, к примеру, роль менеджера проекта и тестировщика. На первоначальном этапе планируется совместная работа по определению масштаба работ и по постановке задач с последующим их распределением. | ||
+ | |||
+ | |||
+ | |||
+ | Компоненты (Из каких частей состоит проект?) | ||
+ | |||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! № !! Этапы проекта!! Этапы разработки!! Результаты по данному этапу | ||
+ | |- | ||
+ | | 1 || Инициализация || Постановка задачи || Проектное задание | ||
+ | |- | ||
+ | | 2 ||rowspan="3"| Проектирование || Анализ задачи и моделирование || rowspan = "2"| Список допущений, ограничений и рисков реализации проекта | ||
+ | |- | ||
+ | | 3 || Разработка или выбор алгоритма решения задачи || | ||
+ | |- | ||
+ | | 4|| Проектирование общей структуры инструмента || Структура функциональных модулей | ||
+ | |||
+ | Модель спецификаций и уровней разработки (основа, по которой будет писаться Руководство пользователя) | ||
+ | |- | ||
+ | | 5|| Планирование || Планирование основных этапов работ || Диаграмма Ганта проекта, | ||
+ | |||
+ | Дорожная карта проекта | ||
+ | |- | ||
+ | | 6||rowspan = "2"| Реализация|| Написание кода || Четкий, понятный код | ||
+ | |- | ||
+ | | 7|| Отладка и тестирование программы || Рабочий прототип инструмента | ||
+ | |- | ||
+ | | 8||rowspan = "2" | Анализ и работа над полученными результатами || Анализ результатов || Анализ результатов | ||
+ | |- | ||
+ | | 9|| Документация || Руководство пользователя | ||
+ | |- | ||
+ | | 10|| Результат || Презентация || Презентация разработанного инструмента, оформленная в .ppt и интерактивное демо | ||
+ | |} | ||
+ | |||
+ | ===Какие будут использоваться технологии? === | ||
+ | |||
+ | # Python/R или другие; | ||
+ | |||
+ | # Реляционные базы данных (MySql, MS SQL etc.); | ||
+ | |||
+ | ===Какие начальные требования? === | ||
+ | |||
+ | # Знания одного из языков программирования (Python, R etc.); | ||
+ | # Знания теории вероятности и математической статистики; | ||
+ | # Знания в области машинного обучения; | ||
+ | # Умение работать в Git. | ||
+ | |||
+ | ===Темы вводных занятий === | ||
+ | |||
+ | # Process Mining: основные концепции и понятия; | ||
+ | # Бизнес аналитика. Виды рисков. Возможные аномалии бизнес-процессов; | ||
+ | # Основы управления проектами: методы приоритизации, организации времени и разработки рабочего плана; | ||
+ | # Риск-менеджмент в организации; | ||
+ | # Принципы работы с очисткой и упорядочивания данных – “tidy data”; | ||
+ | # Презентация: структура и навыки. | ||
+ | |||
+ | |||
+ | |||
+ | ===Критерии оценки === | ||
+ | |||
+ | 8 – 10: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий ключевые показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. Инструмент должен предусматривать возможность добавления новых аналитических блоков. | ||
+ | |||
+ | 6 – 7: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. | ||
+ | |||
+ | 4– 5: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI). | ||
+ | |||
+ | ===Контактная информация === | ||
+ | |||
+ | <br/>Yulia Wasserman | ||
+ | <br/>PwC, Consultant, Risk Assurance | ||
+ | <br/>Office: +79168366786 | ||
+ | <br/>Email: yulia.wasserman@pwc.com |
Версия 11:18, 16 октября 2018
Компания | PwC |
Учебный семестр | Осень 2018 |
Учебный курс | 3-й курс |
Максимальное количество студентов, выбравших проект: 3-5 | |
Что это за проект?
Многие компании, в результате автоматизации бизнес-процессов, накапливают большой объём данных в ERP системах. Массивы информации, появляющейся в результате операционной деятельности компаний, могут быть использованы для многих целей, в том числе для анализа фактического состояния бизнес-процессов, а также разработки планов по их улучшению или изменению.
Проект предполагает разработку аналитического инструмента, который направлен на:
- автоматизированный анализ бизнес-процессов;
- автоматизированная идентификация аномалий с использованием алгоритмов машинного обучения и методов Process Mining.
На входе такой инструмент получает набор табличных данных в виде журнала событий ERP системы по бизнес-процессу. На выходе инструмент формирует отчёт по профилированию процесса, который отражает информацию о наиболее значимых KPI процесса, его узких местах и аномалиях. Так, например, такой инструмент может предоставлять информацию о наиболее часто встречающихся отклонениях от стандартного процесса и потенциальных причинах их появления, а также обнаруживать нетипичные и неоптимальные цепочки событий (например - риск мошенничества, области для оптимизации процесса и т.д.). Впоследствии, на базе данного прототипа планируется разработка инструмента вариативного прогнозирования (Data-driven decision making).
Чему научатся студенты? Что самое интересное в проекте?
- Понимать логику и основы построения бизнес-процессов и оценивать риски возникающих отклонений;
- Применять алгоритмы машинного обучения для статистической обработки системной информации;
- Работать с данными из ERP систем, используемых во всех крупных компаниях (Oracle, SAP, MS Dynamics Axapta etc.);
- Определять и формулировать задачи, организовывать время и работу (time- and project – management);
- Познакомятся с принципом упорядочивания и очистки данных для анализа - “tidy data”;
- Попрактиковаться в написании четкого и понятного кода;
- Составления документации по использованию инструмента;
- Работать в команде.
Организация работы (Как студенты будут работать в команде?)
Проектная команда состоит из 3-5 человек. В рамках проектной команды предполагаются следующие роли участников (однако список этим не ограничивается):
- Специалист по машинному обучению
- Специалист по очистке данных
- Бизнес-аналитик
- Специалист по оценке и анализу рисков
- Менеджер проекта
- Разработчик
- Тестировщик
Каждый участник может попробовать себя в одной или более ролей, совместив, к примеру, роль менеджера проекта и тестировщика. На первоначальном этапе планируется совместная работа по определению масштаба работ и по постановке задач с последующим их распределением.
Компоненты (Из каких частей состоит проект?)
№ | Этапы проекта | Этапы разработки | Результаты по данному этапу |
---|---|---|---|
1 | Инициализация | Постановка задачи | Проектное задание |
2 | Проектирование | Анализ задачи и моделирование | Список допущений, ограничений и рисков реализации проекта |
3 | Разработка или выбор алгоритма решения задачи | ||
4 | Проектирование общей структуры инструмента | Структура функциональных модулей
Модель спецификаций и уровней разработки (основа, по которой будет писаться Руководство пользователя) | |
5 | Планирование | Планирование основных этапов работ | Диаграмма Ганта проекта,
Дорожная карта проекта |
6 | Реализация | Написание кода | Четкий, понятный код |
7 | Отладка и тестирование программы | Рабочий прототип инструмента | |
8 | Анализ и работа над полученными результатами | Анализ результатов | Анализ результатов |
9 | Документация | Руководство пользователя | |
10 | Результат | Презентация | Презентация разработанного инструмента, оформленная в .ppt и интерактивное демо |
Какие будут использоваться технологии?
- Python/R или другие;
- Реляционные базы данных (MySql, MS SQL etc.);
Какие начальные требования?
- Знания одного из языков программирования (Python, R etc.);
- Знания теории вероятности и математической статистики;
- Знания в области машинного обучения;
- Умение работать в Git.
Темы вводных занятий
- Process Mining: основные концепции и понятия;
- Бизнес аналитика. Виды рисков. Возможные аномалии бизнес-процессов;
- Основы управления проектами: методы приоритизации, организации времени и разработки рабочего плана;
- Риск-менеджмент в организации;
- Принципы работы с очисткой и упорядочивания данных – “tidy data”;
- Презентация: структура и навыки.
Критерии оценки
8 – 10: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий ключевые показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. Инструмент должен предусматривать возможность добавления новых аналитических блоков.
6 – 7: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI), информацию об аномалиях и узких местах процесса.
4– 5: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI).
Контактная информация
Yulia Wasserman
PwC, Consultant, Risk Assurance
Office: +79168366786
Email: yulia.wasserman@pwc.com