Анализ успехов школьников на олимпиадах (проект) — различия между версиями
(→Чему вы научитесь?) |
(→Какие начальные требования?) |
||
Строка 30: | Строка 30: | ||
=== Какие начальные требования? === | === Какие начальные требования? === | ||
− | Ответственность и умение соблюдать дедлайны | + | * Ответственность и умение соблюдать дедлайны. |
− | Владение языком Python3 | + | * Владение языком Python3. |
=== Какие будут использоваться технологии? === | === Какие будут использоваться технологии? === |
Версия 17:14, 27 ноября 2015
Ментор | Густокашин Михаил |
Учебный семестр | Весна 2016 |
Учебный курс | 1-й курс |
Проект можно развивать на летней практике | |
Максимальное количество студентов, выбравших проект: 1 | |
Что это за проект?
Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет. Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы.
Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы.
Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ.
Внимание! Срок сдачи проекта - 1 апреля.
Чему вы научитесь?
- Автоматически получать данные с сайтов, не предоставляющих API.
- Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные.
- Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях).
- Анализировать социальные сети.
Какие начальные требования?
- Ответственность и умение соблюдать дедлайны.
- Владение языком Python3.
Какие будут использоваться технологии?
Python3 с библиотеками для получения данных (эмуляция браузера и т.п.)
Библиотеки анализа таблиц в pdf-документах
API Vk.com
Темы вводных занятий
Введение в SQL Основы автоматической обработки web-страниц
Направления развития
Поддержка и развитие проекта в следующие годы
Разработка проекта текущего рейтинга подавших документы во время приемной кампании
Критерии оценки
0: проект не сделан вовремя или не в полном объеме
10: проект сделан вовремя в полном объеме
Ориентировочное расписание занятий
ПН недоступен, ВТ 15:00-19:00, СР недоступен, ЧТ 15:00-18:00, ПТ недоступен, СБ недоступен