Анализ успехов школьников на олимпиадах (проект) — различия между версиями
(→Какие начальные требования?) |
|||
(не показано 12 промежуточных версии 3 участников) | |||
Строка 12: | Строка 12: | ||
=== Что это за проект? === | === Что это за проект? === | ||
Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет. | Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет. | ||
− | Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы. Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы. | + | Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы. |
+ | |||
+ | Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы. | ||
+ | |||
Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ. | Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ. | ||
Строка 18: | Строка 21: | ||
=== Чему вы научитесь? === | === Чему вы научитесь? === | ||
− | Автоматически получать данные с сайтов, не предоставляющих API | + | * Автоматически получать данные с сайтов, не предоставляющих API. |
− | Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные | + | * Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные. |
− | Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях) | + | * Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях). |
− | Анализировать социальные сети | + | * Анализировать социальные сети. |
=== Какие начальные требования? === | === Какие начальные требования? === | ||
− | Ответственность и умение соблюдать дедлайны | + | * Ответственность и умение соблюдать дедлайны. |
− | Владение языком Python3 | + | * Владение языком Python3. |
=== Какие будут использоваться технологии? === | === Какие будут использоваться технологии? === | ||
− | Python3 с библиотеками для получения данных (эмуляция браузера и т.п.) | + | * Python3 с библиотеками для получения данных (эмуляция браузера и т.п.). |
− | Библиотеки анализа таблиц в pdf-документах | + | |
− | API Vk.com | + | * Библиотеки анализа таблиц в pdf-документах. |
+ | |||
+ | * API Vk.com. | ||
=== Темы вводных занятий === | === Темы вводных занятий === | ||
− | Введение в SQL | + | * Введение в SQL. |
− | Основы автоматической обработки web-страниц | + | |
+ | * Основы автоматической обработки web-страниц. | ||
=== Направления развития === | === Направления развития === | ||
− | + | * Поддержка и развитие проекта в следующие годы. | |
+ | |||
+ | * Разработка проекта текущего рейтинга подавших документы во время приемной кампании. | ||
=== Критерии оценки === | === Критерии оценки === | ||
− | 0: проект не сделан вовремя или не в полном объеме | + | 0: проект не сделан вовремя или не в полном объеме. |
− | 10: проект сделан вовремя в полном объеме | + | |
+ | 10: проект сделан вовремя в полном объеме. | ||
=== Ориентировочное расписание занятий === | === Ориентировочное расписание занятий === | ||
− | ПН недоступен | + | ПН недоступен |
+ | |||
+ | ВТ 15:00-19:00 | ||
+ | |||
+ | СР недоступен | ||
+ | |||
+ | ЧТ 15:00-18:00 | ||
+ | |||
+ | ПТ недоступен | ||
+ | |||
+ | СБ недоступен |
Текущая версия на 16:05, 28 июля 2017
Ментор | Густокашин Михаил |
Учебный семестр | Весна 2016 |
Учебный курс | 1-й курс |
Проект можно развивать на летней практике | |
Максимальное количество студентов, выбравших проект: 1 | |
Что это за проект?
Каждый год школьники участвуют в олимпиадах и получают дипломы, которые могут помочь им с поступлением в университет. Целью данного проекта является автоматический сбор информации о победителях и призерах олимпиад по информатике, математике и физике за 2012-2016 годы.
Необходимо будет свести в единую таблицу всю информацию о победителях и призерах олимпиад (фамилия, имя, регион, город, школа, год выпуска, список всех олимпиад с указанием достигнутых успехов). Источники информации неструктурированы и не систематизированы.
Результаты этого проекта будут использованы для составления списка льгот, определения школьников, с которыми необходимо работать лично, а также составления рейтинга школ.
Внимание! Срок сдачи проекта - 1 апреля.
Чему вы научитесь?
- Автоматически получать данные с сайтов, не предоставляющих API.
- Анализировать и стандартизировать данные, предоставленные в разных форматах, неполные и противоречивые данные.
- Получать данные из PDF, в том числе с использованием OCR (в запущенных случаях).
- Анализировать социальные сети.
Какие начальные требования?
- Ответственность и умение соблюдать дедлайны.
- Владение языком Python3.
Какие будут использоваться технологии?
- Python3 с библиотеками для получения данных (эмуляция браузера и т.п.).
- Библиотеки анализа таблиц в pdf-документах.
- API Vk.com.
Темы вводных занятий
- Введение в SQL.
- Основы автоматической обработки web-страниц.
Направления развития
- Поддержка и развитие проекта в следующие годы.
- Разработка проекта текущего рейтинга подавших документы во время приемной кампании.
Критерии оценки
0: проект не сделан вовремя или не в полном объеме.
10: проект сделан вовремя в полном объеме.
Ориентировочное расписание занятий
ПН недоступен
ВТ 15:00-19:00
СР недоступен
ЧТ 15:00-18:00
ПТ недоступен
СБ недоступен