Python для сбора и анализа данных КНАД 25/26

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Преподаватели, учебные ассистенты и ссылки

Группы БКНАД251 БКНАД252 БКНАД253
Лектор Горшков Сергей Сергеевич
Семинаристы Потапов Иван Андреевич Береснева Екатерина Николаевна
Ассистенты Дима Проскуряков Сахават Биннатов Алика Сидорова
Ассистент Лектора Сахават Биннатов

Все записи курса

Чат и канал курса

Вики-страница прошлого года

Форма обратной связи. Можно заполнять когда угодно с любыми вопросами

Курс 1 модуля

Лекции

Четверг 11:10 – 12:30

Дата Тема Материалы
1 16 января Модуль numpy. Основные операции для работы с numpy.array. Презентация Ноутбук
2 22 января Модуль pandas. Ноутбук
3 29 января Параллельность: GIL, многопоточность, многопроцессность, синхронизация. параллельностьcolab performance презентация
4 5 февраля Визуализация данных в Python matplotlib1 matplotlib2 pandas_plot plotly seaborn magic в jupyter
5 12 февраля SQL презентация

Семинары

Код семинаров github

Домашнее задание

Сдача и оценивание

Сдача задач проводится в anytask, инвайты будут опубликованы в телеграм-канале курса.

Максимум за одно ДЗ – 10 баллов. По решению проверяющего могут быть добавлены бонусные баллы за изящные решения.

Указанный в anytask максимальный балл – чисто формальное ограничение платформы: он больше, чем наш максимум, так как в него входят возможные бонусные баллы.

Дедлайны

Ко всем заданиям применяется система мягких и жёстких дедлайнов.

В таблице ДЗ ниже для каждого задания указаны и мягкий, и жёсткий дедлайн.

За каждый день просрочки начисляется штраф –1 балл.

Если работа сдана после жёсткого дедлайна без уважительной причины – за неё ставится 0.

При этом у вас есть одна возможность досдать ДЗ до жёсткого дедлайна без штрафа.

Задание Мягкий дедлайн Жёсткий дедлайн
1 numpy 25.01.2026 23:59 28.01.2026 23:59
2 pandas 03.02.2026 23:59 06.02.2026 23:59
3 join 08.02.2026 23:59 11.02.2026 23:59
4 visualization 12.02.2026 23:59 15.02.2026 23:59

Оценивание

Показатель Формула
Накоп МИНИМУМ((ДЗ1 + ДЗ2 + ДЗ3 + ДЗ4 + ДЗ5 + ДЗ6 + ДЗ7 + ДЗ8) / 8, 10)
Итог ОКРУГЛЕНИЕ(0.7 * Накоп + 0.3 * экз)
Автомат Накоп, если Накоп >= 6 и есть желание получить автомат

Рекомендуемая основная литература

  1. Hadoop. Система для обработки больших объемов данных
  2. Основы SQL – курс Андрея Созыкина
  3. Курс Техносферы: методы распределенной обработки больших объемов данных в Hadoop
  4. NumPy
  5. pandas
  6. Matplotlib

Рекомендуемая дополнительная литература

  1. MRJob documentation
  2. Devpractice Team. Python. Визуализация данных. Matplotlib. Seaborn. Mayavi.
  3. ITCookies: Python
  4. О функции apply в pandas