Predictive segmentation — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Строка 7: Строка 7:
 
|categorize=yes
 
|categorize=yes
 
}}
 
}}
 +
 +
===Описание проекта===
 +
Есть интернет-магазин (OZON), в который заходит большое число как зарегистрированных юзеров (users), так и случайных посетителей (visitors). Нужно сделать сегментацию пользователей по ожидаемому объему продаж, то есть:<br/>--- Придумываем/учим модель, которая предсказывает ожидаемый размер заказа человека, пришедшего на сайт (возможно, в первый раз)<br/>--- Сегментируем пользователей<br/>--- Решаем эту же задачу для товарных категорий
 +
 +
===Чему научатся студенты?===
 +
Это очень сильно поднимет Ваши скиллы в области прикладного машинного обучения. Отличный шанс зайти в e-Commerce.
 +
Глубоко ныряем в бизнес-аналитику для e-Commerce.
 +
Реальные приложения машинного обучения  <br/>--- большие массивы данных (как качественных, так и достаточно грубых), большая свобода в выборе моделей и экспериментов.
 +
 +
===Какие технологии будут использоваться?===
 +
Python/R, возможно, Spark и тд
 +
 +
===Требования, предъявляемые к студентам===
 +
<br/>--- Python или иной язык для анализа данных
 +
<br/>--- Знание машинного обучения (хотя бы на уровне "сдал курс в универе" на хор или отл)
 +
 +
===Критерии оценки итогового результата по проекту===
 +
Есть два варианта:
 +
<br/>Запилить академический проект (статью) или сделать реальный прототип
 +
 +
<br/>Путь 1 (академический):
 +
<br/>--- Написана статья, ее подали в журнал = отлично
 +
<br/>--- Почти написана статья = хорошо
 +
<br/>--- Какая-то работа сделана, но недостаточно для публикации = удовлетворительно
 +
<br/>--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд
 +
<br/>
 +
<br/>Путь 2 (практический)
 +
<br/>--- Модель показала хорошие результаты и ее решили внедрить в продакшн = отл
 +
<br/>--- Модель показала хорошие результаты, решили ее немного доработать (возможно пойдет в продакшн после доработки) = хор
 +
<br/>--- Какие-то результаты есть, но их практическая значимость очень спорна = удов
 +
<br/>--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд"
 +
 +
 +
===Количество часов работы студента в неделю===
 +
от 10
 +
===Предположительная длительность работы по  задаче===
 +
6 месяцев

Версия 10:37, 16 октября 2018

Компания OZON
Учебный семестр Осень 2018
Учебный курс  ?-й курс
Максимальное количество студентов, выбравших проект: 1-2



Описание проекта

Есть интернет-магазин (OZON), в который заходит большое число как зарегистрированных юзеров (users), так и случайных посетителей (visitors). Нужно сделать сегментацию пользователей по ожидаемому объему продаж, то есть:
--- Придумываем/учим модель, которая предсказывает ожидаемый размер заказа человека, пришедшего на сайт (возможно, в первый раз)
--- Сегментируем пользователей
--- Решаем эту же задачу для товарных категорий

Чему научатся студенты?

Это очень сильно поднимет Ваши скиллы в области прикладного машинного обучения. Отличный шанс зайти в e-Commerce. Глубоко ныряем в бизнес-аналитику для e-Commerce. Реальные приложения машинного обучения  
--- большие массивы данных (как качественных, так и достаточно грубых), большая свобода в выборе моделей и экспериментов.

Какие технологии будут использоваться?

Python/R, возможно, Spark и тд

Требования, предъявляемые к студентам


--- Python или иной язык для анализа данных
--- Знание машинного обучения (хотя бы на уровне "сдал курс в универе" на хор или отл)

Критерии оценки итогового результата по проекту

Есть два варианта:
Запилить академический проект (статью) или сделать реальный прототип


Путь 1 (академический):
--- Написана статья, ее подали в журнал = отлично
--- Почти написана статья = хорошо
--- Какая-то работа сделана, но недостаточно для публикации = удовлетворительно
--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд

Путь 2 (практический)
--- Модель показала хорошие результаты и ее решили внедрить в продакшн = отл
--- Модель показала хорошие результаты, решили ее немного доработать (возможно пойдет в продакшн после доработки) = хор
--- Какие-то результаты есть, но их практическая значимость очень спорна = удов
--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд"


Количество часов работы студента в неделю

от 10

Предположительная длительность работы по  задаче

6 месяцев