Анализ успехов школьников на олимпиадах (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Критерии оценки)
(Направления развития)
Строка 43: Строка 43:
  
 
=== Направления развития ===
 
=== Направления развития ===
Нет направлений развития
+
Поддержка и развитие проекта в следующие годы
 +
 
 +
Разработка проекта текущего рейтинга подавших документы во время приемной кампании
  
 
=== Критерии оценки ===
 
=== Критерии оценки ===

Версия 15:41, 26 ноября 2015

Ментор Густокашин Михаил
Учебный семестр Весна 2016
Учебный курс 1-й курс
Проект можно развивать на летней практике
Максимальное количество студентов, выбравших проект: 1



Что это за проект?

Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет. Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы. Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы. Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ.

Внимание! Срок сдачи проекта - 1 апреля.

Чему вы научитесь?

Автоматически получать данные с сайтов, не предоставляющих API

Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные

Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях)

Анализировать социальные сети

Какие начальные требования?

Ответственность и умение соблюдать дедлайны

Владение языком Python3

Какие будут использоваться технологии?

Python3 с библиотеками для получения данных (эмуляция браузера и т.п.)

Библиотеки анализа таблиц в pdf-документах

API Vk.com

Темы вводных занятий

Введение в SQL Основы автоматической обработки web-страниц

Направления развития

Поддержка и развитие проекта в следующие годы

Разработка проекта текущего рейтинга подавших документы во время приемной кампании

Критерии оценки

0: проект не сделан вовремя или не в полном объеме

10: проект сделан вовремя в полном объеме

Ориентировочное расписание занятий

ПН недоступен, ВТ 15:00-19:00, СР недоступен, ЧТ 15:00-18:00, ПТ недоступен, СБ недоступен