Анализ успехов школьников на олимпиадах (проект) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница, с помощью формы Новый_проект)
 
 
(не показано 15 промежуточных версии 3 участников)
Строка 12: Строка 12:
 
=== Что это за проект? ===
 
=== Что это за проект? ===
 
Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет.
 
Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет.
Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы. Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы.
+
Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы.  
 +
 
 +
Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы.
 +
 
 
Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ.
 
Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ.
 +
 
'''Внимание! Срок сдачи проекта - 1 апреля.'''
 
'''Внимание! Срок сдачи проекта - 1 апреля.'''
  
 
=== Чему вы научитесь? ===
 
=== Чему вы научитесь? ===
Автоматически получать данные с сайтов, не предоставляющих API  
+
* Автоматически получать данные с сайтов, не предоставляющих API.
Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные
+
 
Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях)
+
* Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные.
Анализировать социальные сети
+
 
 +
* Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях).
 +
 
 +
* Анализировать социальные сети.
  
 
=== Какие начальные требования? ===
 
=== Какие начальные требования? ===
Ответственность и умение соблюдать дедлайны
+
* Ответственность и умение соблюдать дедлайны.
Владение языком Python3
+
 
 +
* Владение языком Python3.
  
 
=== Какие будут использоваться технологии? ===
 
=== Какие будут использоваться технологии? ===
Python3 с библиотеками для получения данных (эмуляция браузера и т.п.)
+
* Python3 с библиотеками для получения данных (эмуляция браузера и т.п.).
Библиотеки анализа таблиц в pdf-документах
+
 
API Vk.com
+
* Библиотеки анализа таблиц в pdf-документах.
 +
 
 +
* API Vk.com.
  
 
=== Темы вводных занятий ===
 
=== Темы вводных занятий ===
Введение в SQL
+
* Введение в SQL.
Основы автоматической обработки web-страниц
+
 
 +
* Основы автоматической обработки web-страниц.
  
 
=== Направления развития ===
 
=== Направления развития ===
Нет направлений развития
+
* Поддержка и развитие проекта в следующие годы.
 +
 
 +
* Разработка проекта текущего рейтинга подавших документы во время приемной кампании.
  
 
=== Критерии оценки ===
 
=== Критерии оценки ===
0: проект не сделан вовремя или не в полном объеме
+
0: проект не сделан вовремя или не в полном объеме.
10: проект сделан вовремя в полном объеме
+
 
 +
10: проект сделан вовремя в полном объеме.
  
 
=== Ориентировочное расписание занятий ===
 
=== Ориентировочное расписание занятий ===
ПН недоступен, ВТ 15:00-19:00, СР недоступен, ЧТ 15:00-18:00, ПТ недоступен, СБ недоступен
+
ПН недоступен
 +
 
 +
ВТ 15:00-19:00
 +
 
 +
СР недоступен
 +
 
 +
ЧТ 15:00-18:00
 +
 
 +
ПТ недоступен
 +
 
 +
СБ недоступен

Текущая версия на 16:05, 28 июля 2017

Ментор Густокашин Михаил
Учебный семестр Весна 2016
Учебный курс 1-й курс
Проект можно развивать на летней практике
Максимальное количество студентов, выбравших проект: 1



Что это за проект?

Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет. Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы.

Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы.

Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ.

Внимание! Срок сдачи проекта - 1 апреля.

Чему вы научитесь?

  • Автоматически получать данные с сайтов, не предоставляющих API.
  • Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные.
  • Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях).
  • Анализировать социальные сети.

Какие начальные требования?

  • Ответственность и умение соблюдать дедлайны.
  • Владение языком Python3.

Какие будут использоваться технологии?

  • Python3 с библиотеками для получения данных (эмуляция браузера и т.п.).
  • Библиотеки анализа таблиц в pdf-документах.
  • API Vk.com.

Темы вводных занятий

  • Введение в SQL.
  • Основы автоматической обработки web-страниц.

Направления развития

  • Поддержка и развитие проекта в следующие годы.
  • Разработка проекта текущего рейтинга подавших документы во время приемной кампании.

Критерии оценки

0: проект не сделан вовремя или не в полном объеме.

10: проект сделан вовремя в полном объеме.

Ориентировочное расписание занятий

ПН недоступен

ВТ 15:00-19:00

СР недоступен

ЧТ 15:00-18:00

ПТ недоступен

СБ недоступен