Predictive segmentation — различия между версиями
Строка 7: | Строка 7: | ||
|categorize=yes | |categorize=yes | ||
}} | }} | ||
+ | |||
+ | ===Описание проекта=== | ||
+ | Есть интернет-магазин (OZON), в который заходит большое число как зарегистрированных юзеров (users), так и случайных посетителей (visitors). Нужно сделать сегментацию пользователей по ожидаемому объему продаж, то есть:<br/>--- Придумываем/учим модель, которая предсказывает ожидаемый размер заказа человека, пришедшего на сайт (возможно, в первый раз)<br/>--- Сегментируем пользователей<br/>--- Решаем эту же задачу для товарных категорий | ||
+ | |||
+ | ===Чему научатся студенты?=== | ||
+ | Это очень сильно поднимет Ваши скиллы в области прикладного машинного обучения. Отличный шанс зайти в e-Commerce. | ||
+ | Глубоко ныряем в бизнес-аналитику для e-Commerce. | ||
+ | Реальные приложения машинного обучения <br/>--- большие массивы данных (как качественных, так и достаточно грубых), большая свобода в выборе моделей и экспериментов. | ||
+ | |||
+ | ===Какие технологии будут использоваться?=== | ||
+ | Python/R, возможно, Spark и тд | ||
+ | |||
+ | ===Требования, предъявляемые к студентам=== | ||
+ | <br/>--- Python или иной язык для анализа данных | ||
+ | <br/>--- Знание машинного обучения (хотя бы на уровне "сдал курс в универе" на хор или отл) | ||
+ | |||
+ | ===Критерии оценки итогового результата по проекту=== | ||
+ | Есть два варианта: | ||
+ | <br/>Запилить академический проект (статью) или сделать реальный прототип | ||
+ | |||
+ | <br/>Путь 1 (академический): | ||
+ | <br/>--- Написана статья, ее подали в журнал = отлично | ||
+ | <br/>--- Почти написана статья = хорошо | ||
+ | <br/>--- Какая-то работа сделана, но недостаточно для публикации = удовлетворительно | ||
+ | <br/>--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд | ||
+ | <br/> | ||
+ | <br/>Путь 2 (практический) | ||
+ | <br/>--- Модель показала хорошие результаты и ее решили внедрить в продакшн = отл | ||
+ | <br/>--- Модель показала хорошие результаты, решили ее немного доработать (возможно пойдет в продакшн после доработки) = хор | ||
+ | <br/>--- Какие-то результаты есть, но их практическая значимость очень спорна = удов | ||
+ | <br/>--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд" | ||
+ | |||
+ | |||
+ | ===Количество часов работы студента в неделю=== | ||
+ | от 10 | ||
+ | ===Предположительная длительность работы по задаче=== | ||
+ | 6 месяцев |
Версия 10:37, 16 октября 2018
Компания | OZON |
Учебный семестр | Осень 2018 |
Учебный курс | ?-й курс |
Максимальное количество студентов, выбравших проект: 1-2 | |
Описание проекта
Есть интернет-магазин (OZON), в который заходит большое число как зарегистрированных юзеров (users), так и случайных посетителей (visitors). Нужно сделать сегментацию пользователей по ожидаемому объему продаж, то есть:
--- Придумываем/учим модель, которая предсказывает ожидаемый размер заказа человека, пришедшего на сайт (возможно, в первый раз)
--- Сегментируем пользователей
--- Решаем эту же задачу для товарных категорий
Чему научатся студенты?
Это очень сильно поднимет Ваши скиллы в области прикладного машинного обучения. Отличный шанс зайти в e-Commerce.
Глубоко ныряем в бизнес-аналитику для e-Commerce.
Реальные приложения машинного обучения
--- большие массивы данных (как качественных, так и достаточно грубых), большая свобода в выборе моделей и экспериментов.
Какие технологии будут использоваться?
Python/R, возможно, Spark и тд
Требования, предъявляемые к студентам
--- Python или иной язык для анализа данных
--- Знание машинного обучения (хотя бы на уровне "сдал курс в универе" на хор или отл)
Критерии оценки итогового результата по проекту
Есть два варианта:
Запилить академический проект (статью) или сделать реальный прототип
Путь 1 (академический):
--- Написана статья, ее подали в журнал = отлично
--- Почти написана статья = хорошо
--- Какая-то работа сделана, но недостаточно для публикации = удовлетворительно
--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд
Путь 2 (практический)
--- Модель показала хорошие результаты и ее решили внедрить в продакшн = отл
--- Модель показала хорошие результаты, решили ее немного доработать (возможно пойдет в продакшн после доработки) = хор
--- Какие-то результаты есть, но их практическая значимость очень спорна = удов
--- Сделано так мало, что возник вопрос "А что ты делал все это время?" = неуд"
Количество часов работы студента в неделю
от 10
Предположительная длительность работы по задаче
6 месяцев