Автоматизированная идентификация аномалий методами Process Mining — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «{{Карточка_командного_проекта |name=Автоматизированная идентификация аномалий методами Pro…»)
 
 
(не показаны 2 промежуточные версии этого же участника)
Строка 3: Строка 3:
 
|company=PwC
 
|company=PwC
 
|semester=Осень 2018
 
|semester=Осень 2018
|course=3
+
|course=3-4
 
|number_of_students=3-5
 
|number_of_students=3-5
 
|categorize=yes
 
|categorize=yes
 
}}
 
}}
 +
 +
===Что это за проект? ===
 +
 +
Многие компании, в результате автоматизации бизнес-процессов, накапливают большой объём данных в ERP системах. Массивы информации, появляющейся в результате операционной деятельности компаний, могут быть использованы для многих целей, в том числе для анализа фактического состояния бизнес-процессов, а также разработки планов по их улучшению или изменению. 
 +
<br/>Проект предполагает разработку аналитического инструмента, который направлен на:
 +
# автоматизированный анализ бизнес-процессов;
 +
# автоматизированная идентификация аномалий с использованием алгоритмов машинного обучения и методов Process Mining. 
 +
<br/>
 +
На входе такой инструмент получает набор табличных данных в виде журнала событий ERP системы по бизнес-процессу. На выходе инструмент формирует отчёт по профилированию процесса, который отражает информацию о наиболее значимых KPI процесса, его узких местах и аномалиях. Так, например, такой инструмент может предоставлять информацию о наиболее часто встречающихся отклонениях от стандартного процесса и потенциальных причинах их появления, а также обнаруживать нетипичные и неоптимальные цепочки событий (например - риск мошенничества, области для оптимизации процесса и т.д.). Впоследствии, на базе данного прототипа планируется разработка инструмента вариативного прогнозирования (Data-driven decision making). 
 +
 +
===Чему научатся студенты? Что самое интересное в проекте? ===
 +
 +
# Понимать логику и основы построения бизнес-процессов и оценивать риски возникающих отклонений; 
 +
# Применять алгоритмы машинного обучения для статистической обработки системной информации; 
 +
# Работать с данными из ERP систем, используемых во всех крупных компаниях (Oracle, SAP, MS Dynamics Axapta etc.); 
 +
# Определять и формулировать задачи, организовывать время и работу (time- and project – management); 
 +
# Познакомятся с принципом упорядочивания и очистки данных для анализа - “tidy data”; 
 +
# Попрактиковаться в написании четкого и понятного кода;
 +
# Составления документации по использованию инструмента;
 +
# Работать в команде. 
 +
 +
===Организация работы (Как студенты будут работать в команде?) ===
 +
Проектная команда состоит из 3-5 человек. В рамках проектной команды предполагаются следующие роли участников (однако список этим не ограничивается): 
 +
 +
# Специалист по машинному обучению 
 +
# Специалист по очистке данных 
 +
# Бизнес-аналитик 
 +
# Специалист по оценке и анализу рисков 
 +
# Менеджер проекта 
 +
# Разработчик 
 +
# Тестировщик
 +
 +
Каждый участник может попробовать себя в одной или более ролей, совместив, к примеру, роль менеджера проекта и тестировщика. На первоначальном этапе планируется совместная работа по определению масштаба работ и по постановке задач с последующим их распределением. 
 +
 +
 +
 +
Компоненты (Из каких частей состоит проект?)
 +
 +
{| class="wikitable"
 +
|-
 +
! № !! Этапы проекта!! Этапы разработки!! Результаты по данному этапу
 +
|-
 +
| 1 || Инициализация || Постановка задачи || Проектное задание
 +
|-
 +
| 2 ||rowspan="3"| Проектирование || Анализ задачи и моделирование || rowspan = "2"| Список допущений, ограничений и рисков реализации проекта
 +
|-
 +
| 3 || Разработка или выбор алгоритма решения задачи ||
 +
|-
 +
| 4|| Проектирование общей структуры инструмента || Структура функциональных модулей
 +
 +
Модель спецификаций и уровней разработки (основа, по которой будет писаться Руководство пользователя)
 +
|-
 +
| 5|| Планирование || Планирование основных этапов работ || Диаграмма Ганта проекта, 
 +
 +
Дорожная карта проекта
 +
|-
 +
| 6||rowspan = "2"| Реализация|| Написание кода  || Четкий, понятный код
 +
|-
 +
| 7||  Отладка и тестирование программы || Рабочий прототип инструмента
 +
|-
 +
| 8||rowspan = "2" | Анализ и работа над полученными результатами || Анализ результатов || Анализ результатов
 +
|-
 +
| 9|| Документация || Руководство пользователя
 +
|-
 +
| 10|| Результат || Презентация || Презентация разработанного инструмента, оформленная в .ppt и интерактивное демо
 +
|}
 +
 +
===Какие будут использоваться технологии? ===
 +
 +
# Python/R или другие; 
 +
# Реляционные базы данных (MySql, MS SQL etc.);
 +
 +
===Какие начальные требования? ===
 +
 +
# Знания одного из языков программирования (Python, R etc.); 
 +
# Знания теории вероятности и математической статистики;
 +
# Знания в области машинного обучения;
 +
# Умение работать в Git.
 +
 +
===Темы вводных занятий ===
 +
 +
# Process Mining: основные концепции и понятия;
 +
# Бизнес аналитика. Виды рисков. Возможные аномалии бизнес-процессов;
 +
# Основы управления проектами: методы приоритизации, организации времени и разработки рабочего плана;
 +
# Риск-менеджмент в организации;
 +
# Принципы работы с очисткой и упорядочивания данных – “tidy data”;
 +
# Презентация: структура и навыки.
 +
 
 +
 +
 +
===Критерии оценки ===
 +
 +
8 – 10: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий ключевые показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. Инструмент должен предусматривать возможность добавления новых аналитических блоков.
 +
 +
6 – 7: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. 
 +
 +
4– 5: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI).
 +
 +
===Контактная информация ===
 +
 +
<br/>Yulia Wasserman
 +
<br/>PwC, Consultant, Risk Assurance
 +
<br/>Office: +79168366786
 +
<br/>Email: yulia.wasserman@pwc.com

Текущая версия на 14:43, 16 октября 2018

Компания PwC
Учебный семестр Осень 2018
Учебный курс 3-4-й курс
Максимальное количество студентов, выбравших проект: 3-5



Что это за проект?

Многие компании, в результате автоматизации бизнес-процессов, накапливают большой объём данных в ERP системах. Массивы информации, появляющейся в результате операционной деятельности компаний, могут быть использованы для многих целей, в том числе для анализа фактического состояния бизнес-процессов, а также разработки планов по их улучшению или изменению.
Проект предполагает разработку аналитического инструмента, который направлен на:

  1. автоматизированный анализ бизнес-процессов;
  2. автоматизированная идентификация аномалий с использованием алгоритмов машинного обучения и методов Process Mining.


На входе такой инструмент получает набор табличных данных в виде журнала событий ERP системы по бизнес-процессу. На выходе инструмент формирует отчёт по профилированию процесса, который отражает информацию о наиболее значимых KPI процесса, его узких местах и аномалиях. Так, например, такой инструмент может предоставлять информацию о наиболее часто встречающихся отклонениях от стандартного процесса и потенциальных причинах их появления, а также обнаруживать нетипичные и неоптимальные цепочки событий (например - риск мошенничества, области для оптимизации процесса и т.д.). Впоследствии, на базе данного прототипа планируется разработка инструмента вариативного прогнозирования (Data-driven decision making).

Чему научатся студенты? Что самое интересное в проекте?

  1. Понимать логику и основы построения бизнес-процессов и оценивать риски возникающих отклонений;
  2. Применять алгоритмы машинного обучения для статистической обработки системной информации;
  3. Работать с данными из ERP систем, используемых во всех крупных компаниях (Oracle, SAP, MS Dynamics Axapta etc.);
  4. Определять и формулировать задачи, организовывать время и работу (time- and project – management);
  5. Познакомятся с принципом упорядочивания и очистки данных для анализа - “tidy data”;
  6. Попрактиковаться в написании четкого и понятного кода;
  7. Составления документации по использованию инструмента;
  8. Работать в команде.

Организация работы (Как студенты будут работать в команде?)

Проектная команда состоит из 3-5 человек. В рамках проектной команды предполагаются следующие роли участников (однако список этим не ограничивается):

  1. Специалист по машинному обучению
  2. Специалист по очистке данных
  3. Бизнес-аналитик
  4. Специалист по оценке и анализу рисков
  5. Менеджер проекта
  6. Разработчик
  7. Тестировщик

Каждый участник может попробовать себя в одной или более ролей, совместив, к примеру, роль менеджера проекта и тестировщика. На первоначальном этапе планируется совместная работа по определению масштаба работ и по постановке задач с последующим их распределением.


Компоненты (Из каких частей состоит проект?)

Этапы проекта Этапы разработки Результаты по данному этапу
1 Инициализация Постановка задачи Проектное задание
2 Проектирование  Анализ задачи и моделирование Список допущений, ограничений и рисков реализации проекта
3 Разработка или выбор алгоритма решения задачи
4 Проектирование общей структуры инструмента Структура функциональных модулей

Модель спецификаций и уровней разработки (основа, по которой будет писаться Руководство пользователя)

5 Планирование Планирование основных этапов работ Диаграмма Ганта проекта,

Дорожная карта проекта

6 Реализация Написание кода Четкий, понятный код
7 Отладка и тестирование программы Рабочий прототип инструмента
8 Анализ и работа над полученными результатами Анализ результатов Анализ результатов
9 Документация Руководство пользователя
10 Результат Презентация Презентация разработанного инструмента, оформленная в .ppt и интерактивное демо

Какие будут использоваться технологии?

  1. Python/R или другие;
  2. Реляционные базы данных (MySql, MS SQL etc.);

Какие начальные требования?

  1. Знания одного из языков программирования (Python, R etc.);
  2. Знания теории вероятности и математической статистики;
  3. Знания в области машинного обучения;
  4. Умение работать в Git.

Темы вводных занятий

  1. Process Mining: основные концепции и понятия;
  2. Бизнес аналитика. Виды рисков. Возможные аномалии бизнес-процессов;
  3. Основы управления проектами: методы приоритизации, организации времени и разработки рабочего плана;
  4. Риск-менеджмент в организации;
  5. Принципы работы с очисткой и упорядочивания данных – “tidy data”;
  6. Презентация: структура и навыки.


Критерии оценки

8 – 10: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий ключевые показатели эффективности (KPI), информацию об аномалиях и узких местах процесса. Инструмент должен предусматривать возможность добавления новых аналитических блоков.

6 – 7: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI), информацию об аномалиях и узких местах процесса.

4– 5: разработан инструмент с функционалом для автоматического формирования аналитического отчета, включающий показатели эффективности (KPI).

Контактная информация


Yulia Wasserman
PwC, Consultant, Risk Assurance
Office: +79168366786
Email: yulia.wasserman@pwc.com