Публикации (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница, с помощью формы Новый_проект)
 
Строка 24: Строка 24:
 
=== Какие будут использоваться технологии? ===
 
=== Какие будут использоваться технологии? ===
 
TBA
 
TBA
 +
 +
=== Из каких частей состоит проект? ===
 +
* Агрегация трёх реестров публикаций в единую базу данных
 +
* Нормализация данных и удаление нечётких дубликатов
 +
* Расчёт показателей на основе имеющихся данных
 +
* Формирование готового отчёта на основе показателей
 +
* Визуализация данных с гибкими настройками и различными срезами
  
 
=== Темы вводных занятий ===
 
=== Темы вводных занятий ===
Строка 33: Строка 40:
 
=== Критерии оценки ===
 
=== Критерии оценки ===
 
Минимальные требования (на 5-6):
 
Минимальные требования (на 5-6):
 
+
* Корректное сведение трёх баз данных в одну
Корректное сведение трёх баз данных в одну
+
 
+
 
Требования (на 7-8):
 
Требования (на 7-8):
 
+
* Расчёт показателей с возможностью внесения новых показателей
Расчёт показателей с возможностью внесения новых показателей
+
* Формирование отчёта
 
+
Формирование отчёта
+
 
+
 
Требования (на 9-10):
 
Требования (на 9-10):
 
+
* Автоматизированное формирование готовой презентации
Автоматизированное формирование готовой презентации
+
 
+
 
На 10+
 
На 10+
 
+
* Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы
Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы
+
  
 
=== Ориентировочное расписание занятий ===
 
=== Ориентировочное расписание занятий ===
 
TBA
 
TBA

Версия 16:30, 26 сентября 2017

Ментор Матвеев Дмитрий
Учебный семестр Осень 2017
Учебный курс 2-й курс
Максимальное количество студентов, выбравших проект: 4



Что это за проект?

База данных научных публикаций, агрегирующая выгрузки из трёх самых известных источников: Web of Science, Scopus, РИНЦ. + Аналитика нормализованных данных: формирование отчётов, отрисовка диаграмм и создание слайдов для презентаций в разрезе всех факультетов ВШЭ.

Чему вы научитесь?

  • Работа с нечёткими данными, их сведение и нормализация
  • Создание законченной цепочки аналитики: от первичных данных – до визуализации прогресса университета и факультетов

Какие начальные требования?

  • Знание основ баз данных
  • Язык программирования любой, предпочтителен python

Какие будут использоваться технологии?

TBA

Из каких частей состоит проект?

  • Агрегация трёх реестров публикаций в единую базу данных
  • Нормализация данных и удаление нечётких дубликатов
  • Расчёт показателей на основе имеющихся данных
  • Формирование готового отчёта на основе показателей
  • Визуализация данных с гибкими настройками и различными срезами

Темы вводных занятий

TBA

Направления развития

TBA

Критерии оценки

Минимальные требования (на 5-6):

  • Корректное сведение трёх баз данных в одну

Требования (на 7-8):

  • Расчёт показателей с возможностью внесения новых показателей
  • Формирование отчёта

Требования (на 9-10):

  • Автоматизированное формирование готовой презентации

На 10+

  • Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы

Ориентировочное расписание занятий

TBA