Автоматическое обнаружение взаимно каннибализируемых групп товаров
Компания | Sas |
Учебный семестр | Осень 2018 |
Учебный курс | 3-4-й курс |
Максимальное количество студентов, выбравших проект: 2-3 | |
Содержание
|
Что это за проект?
Проблема обнаружения эффекта каннибализации – самая острая из открытых аналитических задач в ритейле. Одним из важных этапов на пути определения эффектов каннибализации – обнаружение групп товаров (и магазинов) в рамках которых происходит взаимопоглощение (каннибализация) спроса (так называемые, семейства товаров). В этом проекте предлагается разработать и применить на реальных данных метод для обнаружения групп товаров, характеризующихся взаимным влиянием друг на друга с точки зрения объёма спроса, помощью методов Machine Learning.
Чему научатся студенты? Что самое интересное в проекте?
- Познакомиться с методами прогнозирования спроса и методами обнаружения причинно-следственных связей.
- Использовать инфраструктуру SAS для подготовки и анализа данных.
- Самое интересное – это попытка найти решение актуальной прикладной задачи анализа даных. В данном проекте предлагается разработать подход с помощью методов машинного обучения, претендующий на универсальность: т.е. будет разработан фреймворк для построения прогнозов по новым товарам независящий от природы данных.
Организация работы (Как студенты будут работать в команде?)
Основные моменты взаимодействия:
- Рабочее окружение (ноутбук с дистрибутивом SAS) предоставляется компанией.
- Разработка ведётся командой из 2-3 человек, каждый из которых отвечает за свою часть задачи.
- Участники проекта могут консультироваться с кураторами (специалисты компании SAS).
- Каждые 2 недели встречаемся и обсуждаем текущее состояние задач.
- Удаленная работа, встречаться нечасто, контакты - по электронным каналам связи (почта, Whatsapp, скайп). .
Компоненты (Из каких частей состоит проект?)
- Систематизация знаний по эффекту каннибализации (лит. обзор).
- Разведочный анализ исходного массива данных.
- Подготовка и анализ данных – работа в системе SAS, open-source инструментах.
- Выбор подхода к учету эффекта каннибализации в проекте.
- Применение и анализ эффекта от предложенного подхода.
Какие будут использоваться технологии?
Для реализации проекта студентам потребуется освоить ПО SAS. Будут использоваться следующие продукты:
- SAS BASE и SAS Enterprise Guide – для анализа данных и разработки алгоритмов;
- SAS Enterprise Miner и SAS Forecast Server;
- возможно, потребуется использовать open-source инструментов (Python, R).
Какие начальные требования?
Навыки анализа данных. Навыки программирования (C, С++, C#, Python, R и др.) и знание SQL-like языков.
Представления о задачах интеллектуального анализа, алгоритмов Machine Learning
Темы вводных занятий
- Постановка задачи прогнозирования спроса, план работа по проекту, погружение в специфику задач анализа данных в ритейле.
- Знакомство с SAS и входными данными
- План работ по исследованию данных и разработке алгоритма поиска взаимно каннибализаируемых групп (семейств) товаров
Критерии оценки
- 8-10 – разработана полноценная система для определения групп взаимно каннибализируемых групп (семейств) товаров, создано её описание.
- 6-7 – разработана архитектура системы и верхнеуровневое описание методов.
- 4-5 – проведение анализа данных, выявление зависимостей и закономерностей. Подготовлен лит. обзор известных методов обнаружения эффектов каннибализации.
Похожие проекты
Учёт эффекта каннибализации в моделях прогнозирования спроса (в ритейл-сети)
Контактная информация
Алексей Романенко (Alexey.Romanenko@sas.com), Дмитрий Звежинский (Dmitry.Zvezhinsky@sas.com)