Автоматическое обнаружение взаимно каннибализируемых групп товаров

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Компания Sas
Учебный семестр Осень 2018
Учебный курс 3-4-й курс
Максимальное количество студентов, выбравших проект: 2-3



Что это за проект?

Проблема обнаружения эффекта каннибализации – самая острая из открытых аналитических задач в ритейле. Одним из важных этапов на пути определения эффектов каннибализации – обнаружение групп товаров (и магазинов) в рамках которых происходит взаимопоглощение (каннибализация) спроса (так называемые, семейства товаров). В этом проекте предлагается разработать и применить на реальных данных метод для обнаружения групп товаров, характеризующихся взаимным влиянием друг на друга с точки зрения объёма спроса, помощью методов Machine Learning.

Чему научатся студенты? Что самое интересное в проекте?

  • Познакомиться с методами прогнозирования спроса и методами обнаружения причинно-следственных связей.
  • Использовать инфраструктуру SAS для подготовки и анализа данных.
  • Самое интересное – это попытка найти решение актуальной прикладной задачи анализа даных. В данном проекте предлагается разработать подход с помощью методов машинного обучения, претендующий на универсальность: т.е. будет разработан фреймворк для построения прогнозов по новым товарам независящий от природы данных.

Организация работы (Как студенты будут работать в команде?)

Основные моменты взаимодействия:

  • Рабочее окружение (ноутбук с дистрибутивом SAS) предоставляется компанией.
  • Разработка ведётся командой из 2-3 человек, каждый из которых отвечает за свою часть задачи.
  • Участники проекта могут консультироваться с кураторами (специалисты компании SAS).
  • Каждые 2 недели встречаемся и обсуждаем текущее состояние задач.
  • Удаленная работа, встречаться нечасто, контакты - по электронным каналам связи (почта, Whatsapp, скайп). .

Компоненты (Из каких частей состоит проект?)

  • Систематизация знаний по эффекту каннибализации (лит. обзор).
  • Разведочный анализ исходного массива данных.
  • Подготовка и анализ данных – работа в системе SAS, open-source инструментах.
  • Выбор подхода к учету эффекта каннибализации в проекте.
  • Применение и анализ эффекта от предложенного подхода.

Какие будут использоваться технологии?

Для реализации проекта студентам потребуется освоить ПО SAS. Будут использоваться следующие продукты:

  • SAS BASE и SAS Enterprise Guide – для анализа данных и разработки алгоритмов;
  • SAS Enterprise Miner и SAS Forecast Server;
  • возможно, потребуется использовать open-source инструментов (Python, R).


Какие начальные требования?

Навыки анализа данных. Навыки программирования (C, С++, C#, Python, R и др.) и знание SQL-like языков.

Представления о задачах интеллектуального анализа, алгоритмов Machine Learning

Темы вводных занятий

  1. Постановка задачи прогнозирования спроса, план работа по проекту, погружение в специфику задач анализа данных в ритейле.
  2. Знакомство с SAS и входными данными
  3. План работ по исследованию данных и разработке алгоритма поиска взаимно каннибализаируемых групп (семейств) товаров


Критерии оценки

  • 8-10 – разработана полноценная система для определения групп взаимно каннибализируемых групп (семейств) товаров, создано её описание.
  • 6-7 – разработана архитектура системы и верхнеуровневое описание методов.
  • 4-5 – проведение анализа данных, выявление зависимостей и закономерностей. Подготовлен лит. обзор известных методов обнаружения эффектов каннибализации.

Похожие проекты

Учёт эффекта каннибализации в моделях прогнозирования спроса (в ритейл-сети)

Контактная информация

Алексей Романенко (Alexey.Romanenko@sas.com), Дмитрий Звежинский (Dmitry.Zvezhinsky@sas.com)