Публикации (проект) — различия между версиями
Материал из Wiki - Факультет компьютерных наук
(Новая страница, с помощью формы Новый_проект) |
|||
Строка 24: | Строка 24: | ||
=== Какие будут использоваться технологии? === | === Какие будут использоваться технологии? === | ||
TBA | TBA | ||
+ | |||
+ | === Из каких частей состоит проект? === | ||
+ | * Агрегация трёх реестров публикаций в единую базу данных | ||
+ | * Нормализация данных и удаление нечётких дубликатов | ||
+ | * Расчёт показателей на основе имеющихся данных | ||
+ | * Формирование готового отчёта на основе показателей | ||
+ | * Визуализация данных с гибкими настройками и различными срезами | ||
=== Темы вводных занятий === | === Темы вводных занятий === | ||
Строка 33: | Строка 40: | ||
=== Критерии оценки === | === Критерии оценки === | ||
Минимальные требования (на 5-6): | Минимальные требования (на 5-6): | ||
− | + | * Корректное сведение трёх баз данных в одну | |
− | Корректное сведение трёх баз данных в одну | + | |
− | + | ||
Требования (на 7-8): | Требования (на 7-8): | ||
− | + | * Расчёт показателей с возможностью внесения новых показателей | |
− | + | * Формирование отчёта | |
− | + | ||
− | + | ||
− | + | ||
Требования (на 9-10): | Требования (на 9-10): | ||
− | + | * Автоматизированное формирование готовой презентации | |
− | + | ||
− | + | ||
На 10+ | На 10+ | ||
− | + | * Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы | |
− | + | ||
=== Ориентировочное расписание занятий === | === Ориентировочное расписание занятий === | ||
TBA | TBA |
Версия 16:30, 26 сентября 2017
Ментор | Матвеев Дмитрий |
Учебный семестр | Осень 2017 |
Учебный курс | 2-й курс |
Максимальное количество студентов, выбравших проект: 4 | |
Что это за проект?
База данных научных публикаций, агрегирующая выгрузки из трёх самых известных источников: Web of Science, Scopus, РИНЦ. + Аналитика нормализованных данных: формирование отчётов, отрисовка диаграмм и создание слайдов для презентаций в разрезе всех факультетов ВШЭ.
Чему вы научитесь?
- Работа с нечёткими данными, их сведение и нормализация
- Создание законченной цепочки аналитики: от первичных данных – до визуализации прогресса университета и факультетов
Какие начальные требования?
- Знание основ баз данных
- Язык программирования любой, предпочтителен python
Какие будут использоваться технологии?
TBA
Из каких частей состоит проект?
- Агрегация трёх реестров публикаций в единую базу данных
- Нормализация данных и удаление нечётких дубликатов
- Расчёт показателей на основе имеющихся данных
- Формирование готового отчёта на основе показателей
- Визуализация данных с гибкими настройками и различными срезами
Темы вводных занятий
TBA
Направления развития
TBA
Критерии оценки
Минимальные требования (на 5-6):
- Корректное сведение трёх баз данных в одну
Требования (на 7-8):
- Расчёт показателей с возможностью внесения новых показателей
- Формирование отчёта
Требования (на 9-10):
- Автоматизированное формирование готовой презентации
На 10+
- Автоматизированная выгрузка первичных баз публикаций с сайтов и формирование готовой базы
Ориентировочное расписание занятий
TBA