Определение близости друзей в Last.fm (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница, с помощью формы Новый_проект)
 
 
(не показано 7 промежуточных версии 3 участников)
Строка 2: Строка 2:
 
|name=Определение близости друзей в Last.fm
 
|name=Определение близости друзей в Last.fm
 
|mentor=Красавина Алина
 
|mentor=Красавина Алина
|mentor_login={{URLENCODE:{{REVISIONUSER}}|WIKI}}
+
|mentor_login={{URLENCODE:Akrasavina|WIKI}}
 
|semester=Весна 2015
 
|semester=Весна 2015
 
|course=1
 
|course=1
 
|summer=on
 
|summer=on
 
|categorize=yes
 
|categorize=yes
 +
|is_archived=yes
 
}}
 
}}
  
Строка 14: Строка 15:
 
=== Чему вы научитесь? ===
 
=== Чему вы научитесь? ===
 
* Извлекать данные из API сервиса (XML RPC)
 
* Извлекать данные из API сервиса (XML RPC)
* Понимать что такое мера близости
+
* Понимать, что такое мера близости
 
* При выборе соответствующих дополнительных опций - кластеризации, с использованием готовых инструментов
 
* При выборе соответствующих дополнительных опций - кластеризации, с использованием готовых инструментов
  
Строка 24: Строка 25:
 
=== Какие будут использоваться технологии? ===
 
=== Какие будут использоваться технологии? ===
 
* Python (или любой другой популярный язык)
 
* Python (или любой другой популярный язык)
* XML RPC
+
* XML или JSON RPC
  
 
=== Темы вводных занятий ===
 
=== Темы вводных занятий ===
 
+
* Lastfm API, Получение данных. XML, JSON и Python.
 +
* Меры близости и данные с Lastfm. Кластеризация, что это и зачем.
  
 
=== Направления развития ===
 
=== Направления развития ===
Строка 37: Строка 39:
  
 
=== Критерии оценки ===
 
=== Критерии оценки ===
"удовл": скрипт, который забирает данные, складывает их в базу или иное место (файл да диске, например), определение меры близости только по прослушанным жанрам или только по прослушанным исполнителям
+
4-5: скрипт, который забирает данные, складывает их в базу или иное место (файл да диске, например), определение меры близости только по прослушанным жанрам или только по прослушанным исполнителям
  
"хор": то же, что и "удовл", + участие и множества исполнителей, и множества жанров в определении близости
+
6-7: то же, что и для "4-5", + участие и множества исполнителей, и множества жанров в определении близости
  
"отл": то же, что и "хор", + дополнительная опция из оставшихся, кроме, визуализации
+
8-10: то же, что и для "6-7", + дополнительная опция из оставшихся, кроме визуализации

Текущая версия на 10:46, 20 октября 2015

Ментор Красавина Алина
Учебный семестр Весна 2015
Учебный курс 1-й курс
Проект можно развивать на летней практике


Внимание! Данный проект находится в архиве и реализован не будет.

Что это за проект?

В итоге должна получиться консольная утилита, которая принимает на вход имена двух пользователей (нужно знать заранее, что они есть в базе данных). Отдает процент совместимости музыкальных вкусов этих двух пользователей. Дает возможность обсудить с кем-то любимую музыку и найти новую :)

Чему вы научитесь?

  • Извлекать данные из API сервиса (XML RPC)
  • Понимать, что такое мера близости
  • При выборе соответствующих дополнительных опций - кластеризации, с использованием готовых инструментов

Какие начальные требования?

  • Быть знакомым с API Last.fm
  • Быть знакомым со средствами, позволяющими работать с ними
  • Владение любым популярным языком программирования

Какие будут использоваться технологии?

  • Python (или любой другой популярный язык)
  • XML или JSON RPC

Темы вводных занятий

  • Lastfm API, Получение данных. XML, JSON и Python.
  • Меры близости и данные с Lastfm. Кластеризация, что это и зачем.

Направления развития

  • Определение близости не только по исполнителям, но и по прослушанным жанрам (это то, чего не делает Last.fm, нужно для "хор")
  • Определение веса жанра по количеству прослушиваний, участие веса в метрике
  • Определение родственности жанров на основе собранных данных (можно использовать иные источники, например, Википедию), использование родственности в метрике
  • Кластеризация пользователей
  • Визуализация полученных результатов

Критерии оценки

4-5: скрипт, который забирает данные, складывает их в базу или иное место (файл да диске, например), определение меры близости только по прослушанным жанрам или только по прослушанным исполнителям

6-7: то же, что и для "4-5", + участие и множества исполнителей, и множества жанров в определении близости

8-10: то же, что и для "6-7", + дополнительная опция из оставшихся, кроме визуализации