Публикации (проект)

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
Ментор Матвеев Дмитрий
Учебный семестр Осень 2017
Учебный курс 2-й курс
Максимальное количество студентов, выбравших проект: 4



Что это за проект?

База данных научных публикаций, агрегирующая выгрузки из трёх самых известных источников: Web of Science, Scopus, РИНЦ. + Аналитика нормализованных данных: формирование отчётов, отрисовка диаграмм и создание слайдов для презентаций в разрезе всех факультетов ВШЭ.

Чему вы научитесь?

  • Работа с нечёткими данными, их сведение и нормализация
  • Создание законченной цепочки аналитики: от первичных данных – до визуализации прогресса университета и факультетов

Какие начальные требования?

  • Знание основ баз данных
  • Язык программирования любой, предпочтителен python

Какие будут использоваться технологии?

TBA

Из каких частей состоит проект?

  • Агрегация трёх реестров публикаций в единую базу данных
  • Нормализация данных и удаление нечётких дубликатов
  • Расчёт показателей на основе имеющихся данных
  • Формирование готового отчёта на основе показателей
  • Визуализация данных с гибкими настройками и различными срезами

Темы вводных занятий

TBA

Направления развития

TBA

Критерии оценки

Минимальные требования (на 5-6):

  • Корректное сведение трёх баз данных в одну

Требования (на 7-8):

  • Расчёт показателей с возможностью внесения новых показателей
  • Формирование отчёта

Требования (на 9-10):

  • Автоматизированное формирование готовой презентации

На 10+

  • Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы

Ориентировочное расписание занятий

TBA