Публикации (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Скорректированы критерии оценки)
Строка 39: Строка 39:
  
 
=== Критерии оценки ===
 
=== Критерии оценки ===
Минимальные требования (на 5-6):
+
Минимальные требования (на 4-5):
 
* Корректное сведение трёх баз данных в одну
 
* Корректное сведение трёх баз данных в одну
Требования (на 7-8):
+
* Нормализация и пополнение данных
 +
Требования на 6-7:
 +
* Обнаружение и сведение дубликатов
 +
Требования на 8-9:
 
* Расчёт показателей с возможностью внесения новых показателей
 
* Расчёт показателей с возможностью внесения новых показателей
 
* Формирование отчёта
 
* Формирование отчёта
Требования (на 9-10):
+
Требования на 10:
 
* Автоматизированное формирование готовой презентации
 
* Автоматизированное формирование готовой презентации
На 10+
 
* Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы
 
  
 
=== Ориентировочное расписание занятий ===
 
=== Ориентировочное расписание занятий ===
 
TBA
 
TBA

Версия 11:43, 29 сентября 2017

Ментор Матвеев Дмитрий
Учебный семестр Осень 2017
Учебный курс 2-й курс
Максимальное количество студентов, выбравших проект: 4



Что это за проект?

База данных научных публикаций, агрегирующая выгрузки из трёх самых известных источников: Web of Science, Scopus, РИНЦ. + Аналитика нормализованных данных: формирование отчётов, отрисовка диаграмм и создание слайдов для презентаций в разрезе всех факультетов ВШЭ.

Чему вы научитесь?

  • Работа с нечёткими данными, их сведение и нормализация
  • Создание законченной цепочки аналитики: от первичных данных – до визуализации прогресса университета и факультетов

Какие начальные требования?

  • Знание основ баз данных
  • Язык программирования любой, предпочтителен python

Какие будут использоваться технологии?

TBA

Из каких частей состоит проект?

  • Агрегация трёх реестров публикаций в единую базу данных
  • Нормализация данных и удаление нечётких дубликатов
  • Расчёт показателей на основе имеющихся данных
  • Формирование готового отчёта на основе показателей
  • Визуализация данных с гибкими настройками и различными срезами

Темы вводных занятий

TBA

Направления развития

TBA

Критерии оценки

Минимальные требования (на 4-5):

  • Корректное сведение трёх баз данных в одну
  • Нормализация и пополнение данных

Требования на 6-7:

  • Обнаружение и сведение дубликатов

Требования на 8-9:

  • Расчёт показателей с возможностью внесения новых показателей
  • Формирование отчёта

Требования на 10:

  • Автоматизированное формирование готовой презентации

Ориентировочное расписание занятий

TBA