Predictive segmentation

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Компания OZON
Учебный семестр Осень 2018
Учебный курс  ?-й курс
Максимальное количество студентов, выбравших проект: 1-2



Описание проекта

Есть интернет-магазин (OZON), в который заходит большое число как зарегистрированных юзеров (users), так и случайных посетителей (visitors). Нужно сделать сегментацию пользователей по ожидаемому объему продаж, то есть:
--- Придумываем/учим модель, которая предсказывает ожидаемый размер заказа человека, пришедшего на сайт (возможно, в первый раз)
--- Сегментируем пользователей
--- Решаем эту же задачу для товарных категорий

Чему научатся студенты?

Это очень сильно поднимет Ваши скиллы в области прикладного машинного обучения. Отличный шанс зайти в e-Commerce. Глубоко ныряем в бизнес-аналитику для e-Commerce. Реальные приложения машинного обучения  
--- большие массивы данных (как качественных, так и достаточно грубых), большая свобода в выборе моделей и экспериментов.

Какие технологии будут использоваться?

Python/R, возможно, Spark и тд

Требования, предъявляемые к студентам


--- Python или иной язык для анализа данных
--- Знание машинного обучения (хотя бы на уровне "сдал курс в универе" на хор или отл)

Критерии оценки итогового результата по проекту

Есть два варианта:
Запилить академический проект (статью) или сделать реальный прототип


Путь 1 (академический):
--- Написана статья, ее подали в журнал = отлично
--- Почти написана статья = хорошо
--- Какая-то работа сделана, но недостаточно для публикации = удовлетворительно
--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд

Путь 2 (практический)
--- Модель показала хорошие результаты и ее решили внедрить в продакшн = отл
--- Модель показала хорошие результаты, решили ее немного доработать (возможно пойдет в продакшн после доработки) = хор
--- Какие-то результаты есть, но их практическая значимость очень спорна = удов
--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд"


Количество часов работы студента в неделю

от 10

Предположительная длительность работы по  задаче

6 месяцев

Контакты

Zvereva Olga [ozvereva@ozon.ru]